Jump to content
  • Sign Up

yellyex

User
  • Content Count

    9,413
  • Joined

  • Last visited

  • Days Won

    1
  • Time Online

    53d 1h 43m 55s

6 Followers

About yellyex

  • Rank
    Отдыхающий
  • Birthday 11/22/1995

Profile Information

  • Gender
    Male

Recent Profile Visitors

21,663 profile views
  1. идет выкачка всего контента на планете Как его запустить-то? :) Через что? Через ярлык?
  2. Скачал парсер с гитхаба для tululu.org и он не работает https://github.com/GeorgyMaximov/tululu-parser
  3. А я сам мудак. Это сам сайт их засовывает :) Сорян сорян.
  4. Не получается. Нужно просто хотябы .txt форматы скачать. Нафиг их в zip засовывать. Они с ошибками и половина не открывается. :(
  5. Тебе же написали что только для txt написано. А я не видел :) В общем он на рандомной книге ошибку выдаёт. Ну корчое ещё раз спасибо. скинь ошибку текстом а не скрином В общем он всё скачивает, а на рандомной книге выдаёт ошибку. Traceback (most recent call last): File "C:/Users/User/Desktop/parcer.py", line 36, in <module> asyncio.run(get_books_links('https://royallib.com/genre/voennoe_delo/')) File "C:\Program Files\Python312\Lib\asyncio\runners.py", line 194, in run return runner.run(main) File "C:\Program Files\Python312\Lib\asyncio\runners.py", line 118, in run return self._loop.run_until_complete(task) File "C:\Program Files\Python312\Lib\asyncio\base_events.py", line 687, in run_until_complete return future.result() File "C:/Users/User/Desktop/parcer.py", line 14, in get_books_links await asyncio.gather(*tasks) File "C:/Users/User/Desktop/parcer.py", line 25, in download_book with open(f"{book_name}.zip", 'wb') as f: OSError: [Errno 22] Invalid argument: 'iz_otchyota__3_vl_ginzburga_"1_ispolzovanie_Li6D_v_sloyke…".zip'
  6. Уверен что выдает там где у книги не приложен txt формат. Обернешь кусок внизу в цикл по "download_extensions" и всё заробит Ну я так и подумал :)
  7. Тебе же написали что только для txt написано. А я не видел :) В общем он на рандомной книге ошибку выдаёт. Ну корчое ещё раз спасибо.
  8. @... Спасибо :) Я не нашёл строчку выбора места сохранения. Ну ладно сам допишу :) Спасибо, что помог! :) Не, чё то не то. Не всё скачивает. Короче из-за чего-то идут ошибки при скачивании в разных местах. Я попробую разобраться.
  9. Я попросил. :) Просьба не грех.
  10. вроде все расписал в чем конкретно сложность? как выбрать пасер на питоне? загугли Python html parser тебе нужно найти по какому пути лежат ссылки на скачивание (если они там есть - иногда они могут быть зашиты в джаваскрипте и выдаваться по клику). открываешь либо в тектовом редакторе, либо еще лучше в chrome dev tools - там наводишь на элемент который обычно скачивает и смотришь из чего он состоит - гдето должна быть ссылка (если она там есть) ну а дальше пишешь в питон программе как добраться до этого элемента и взять текст ссылки - а дальше имея текст ссылки - отправляешь хттп запрос по этому юрл Да уже загуглил, но они все разные. Я скачал несколько сижу разбираюсь, как подстроить их под свою задачу. Кажется, что парсер написанный продотерами будет быстрее и эффективней тебе надо распарсить страницу чтобы получить линки на страницу с книгой вот ето потом просто поменять линк в нужный формат https://royallib.com/book/baryatinskiy_mihail/_trofeynaya_bronetankovaya_tehnika_vermahta.html https://royallib.com/get/fb2/baryatinskiy_mihail/_trofeynaya_bronetankovaya_tehnika_vermahta.zip https://royallib.com/get/epub/baryatinskiy_mihail/_trofeynaya_bronetankovaya_tehnika_vermahta.zip первый линк это ссылка на страницу книги второй и третий линк на скачивание Да это хороший выход у тебя там тестовое задание или чо ето зачем? Нет, готовлюсь к апокалипсису. Запасаюсь книгами :)
  11. вроде все расписал в чем конкретно сложность? как выбрать пасер на питоне? загугли Python html parser тебе нужно найти по какому пути лежат ссылки на скачивание (если они там есть - иногда они могут быть зашиты в джаваскрипте и выдаваться по клику). открываешь либо в тектовом редакторе, либо еще лучше в chrome dev tools - там наводишь на элемент который обычно скачивает и смотришь из чего он состоит - гдето должна быть ссылка (если она там есть) ну а дальше пишешь в питон программе как добраться до этого элемента и взять текст ссылки - а дальше имея текст ссылки - отправляешь хттп запрос по этому юрл Да уже загуглил, но они все разные. Я скачал несколько сижу разбираюсь, как подстроить их под свою задачу. Кажется, что парсер написанный продотерами будет быстрее и эффективней тебе надо распарсить страницу чтобы получить линки на страницу с книгой вот ето потом просто поменять линк в нужный формат https://royallib.com/book/baryatinskiy_mihail/_trofeynaya_bronetankovaya_tehnika_vermahta.html https://royallib.com/get/fb2/baryatinskiy_mihail/_trofeynaya_bronetankovaya_tehnika_vermahta.zip https://royallib.com/get/epub/baryatinskiy_mihail/_trofeynaya_bronetankovaya_tehnika_vermahta.zip первый линк это ссылка на страницу книги второй и третий линк на скачивание Да это хороший выход
  12. вроде все расписал в чем конкретно сложность? как выбрать пасер на питоне? загугли Python html parser тебе нужно найти по какому пути лежат ссылки на скачивание (если они там есть - иногда они могут быть зашиты в джаваскрипте и выдаваться по клику). открываешь либо в тектовом редакторе, либо еще лучше в chrome dev tools - там наводишь на элемент который обычно скачивает и смотришь из чего он состоит - гдето должна быть ссылка (если она там есть) ну а дальше пишешь в питон программе как добраться до этого элемента и взять текст ссылки - а дальше имея текст ссылки - отправляешь хттп запрос по этому юрл Да уже загуглил, но они все разные. Я скачал несколько сижу разбираюсь, как подстроить их под свою задачу. Кажется, что парсер написанный продотерами будет быстрее и эффективней
  13. Привет! :) Ребят, пожалуйста помогите написать парсер на скачивание книг с сайта. На питоне. Порядок действий: 1. Пользователь открывает страницу. Страница наполнена всеми книгами нужного жанра. Например: https://royallib.com/genre/voennoe_delo/ 2. Далее вводим эту страницу в код питона. 3. Каждую книгу нужно скачать нужно в нескольких форматах: .txt; .doc; .fb2 4. Нажимаем выполнить в программе.
  14. Тундра вперёд! :)
  15. бля ну тундра тогда точно въеб, у тебя ж аура чистильщика мойки ну пиздец, нахуй ты написал это Ты же не пророк, чтобы такое утверждать? :)
×
×
  • Create New...