PyNyaaTa/pynyaata/bridge/nyaa.py

from datetime import datetime
from typing import List

from bs4 import BeautifulSoup
from pydantic import HttpUrl, parse_obj_as

from pynyaata.cache import cache_data
from pynyaata.constants import VF_WORDS
from pynyaata.requests import requests
from pynyaata.types import Bridge, Color, RemoteFile

from requests import HTTPError
from urllib.parse import urlencode


class Nyaa(Bridge):
    color = Color.INFO
    title = "Nyaa"
    base_url = parse_obj_as(HttpUrl, "https://nyaa.si")
    favicon = parse_obj_as(HttpUrl, "https://nyaa.si/static/favicon.png")

    def search_url(self, query: str = "", page: int = 1) -> HttpUrl:
        to_query = "|".join(map(lambda word: f"({query} {word})", VF_WORDS))
        params = urlencode(
            {
                "f": 0,
                "c": "1_3",
                "q": to_query,
                "s": "size" if query else "id",
                "o": "desc",
                "p": page,
            }
        )

        return parse_obj_as(HttpUrl, f"{self.base_url}?{params}")

    @cache_data
    def search(self, query: str = "", page: int = 1) -> List[RemoteFile]:
        response = requests.get(self.search_url(query, page))

        if response.status_code != 200:
            raise HTTPError()

        torrents: List[RemoteFile] = []
        html = BeautifulSoup(response.content, "html.parser")
        trs = html.select("table.torrent-list tr")

        for i, tr in enumerate(trs):
            if not i:
                continue

            tds = tr.find_all("td")
            urls = tds[1].find_all("a")
            links = tds[2].find_all("a")

            torrents.append(
                RemoteFile(
                    id=urls[1 if len(urls) > 1 else 0]["href"].split("/")[-1],
                    category=tds[0].a["title"],
                    color=Color[tr["class"][0].upper()],
                    name=urls[1 if len(urls) > 1 else 0].get_text(),
                    link=f"{self.base_url}{urls[1 if len(urls) > 1 else 0]['href']}",
                    comment=urls[0].get_text() if len(urls) > 1 else 0,
                    comment_url=f"{self.base_url}{urls[0]['href']}",
                    magnet=links[1]["href"],
                    torrent=f"{self.base_url}{links[0]['href']}",
                    size=tds[3].get_text(),
                    date=datetime.fromtimestamp(int(tds[4]["data-timestamp"])),
                    seeds=tds[5].get_text(),
                    leechs=tds[6].get_text(),
                    downloads=tds[7].get_text(),
                    nb_pages=html.select("ul.pagination li")[-2].get_text(),
                )
            )

        return torrents
stash 2022-10-26 13:06:04 +00:00			`from datetime import datetime`
			`from typing import List`

			`from bs4 import BeautifulSoup`
			`from pydantic import HttpUrl, parse_obj_as`

			`from pynyaata.cache import cache_data`
			`from pynyaata.constants import VF_WORDS`
			`from pynyaata.requests import requests`
			`from pynyaata.types import Bridge, Color, RemoteFile`

			`from requests import HTTPError`
			`from urllib.parse import urlencode`


			`class Nyaa(Bridge):`
			`color = Color.INFO`
			`title = "Nyaa"`
			`base_url = parse_obj_as(HttpUrl, "https://nyaa.si")`
			`favicon = parse_obj_as(HttpUrl, "https://nyaa.si/static/favicon.png")`

			`def search_url(self, query: str = "", page: int = 1) -> HttpUrl:`
			`to_query = "\|".join(map(lambda word: f"({query} {word})", VF_WORDS))`
			`params = urlencode(`
			`{`
			`"f": 0,`
			`"c": "1_3",`
			`"q": to_query,`
			`"s": "size" if query else "id",`
			`"o": "desc",`
			`"p": page,`
			`}`
			`)`

			`return parse_obj_as(HttpUrl, f"{self.base_url}?{params}")`

			`@cache_data`
			`def search(self, query: str = "", page: int = 1) -> List[RemoteFile]:`
			`response = requests.get(self.search_url(query, page))`

			`if response.status_code != 200:`
			`raise HTTPError()`

			`torrents: List[RemoteFile] = []`
			`html = BeautifulSoup(response.content, "html.parser")`
			`trs = html.select("table.torrent-list tr")`

			`for i, tr in enumerate(trs):`
			`if not i:`
			`continue`

			`tds = tr.find_all("td")`
			`urls = tds[1].find_all("a")`
			`links = tds[2].find_all("a")`

			`torrents.append(`
			`RemoteFile(`
			`id=urls[1 if len(urls) > 1 else 0]["href"].split("/")[-1],`
			`category=tds[0].a["title"],`
			`color=Color[tr["class"][0].upper()],`
			`name=urls[1 if len(urls) > 1 else 0].get_text(),`
			`link=f"{self.base_url}{urls[1 if len(urls) > 1 else 0]['href']}",`
			`comment=urls[0].get_text() if len(urls) > 1 else 0,`
			`comment_url=f"{self.base_url}{urls[0]['href']}",`
			`magnet=links[1]["href"],`
			`torrent=f"{self.base_url}{links[0]['href']}",`
			`size=tds[3].get_text(),`
			`date=datetime.fromtimestamp(int(tds[4]["data-timestamp"])),`
			`seeds=tds[5].get_text(),`
			`leechs=tds[6].get_text(),`
			`downloads=tds[7].get_text(),`
			`nb_pages=html.select("ul.pagination li")[-2].get_text(),`
			`)`
			`)`

			`return torrents`