Перейти к публикации
  • Сейчас на странице   Всего пользователей: 4   (2 пользователя, 2 гостя)

Rooster

Программирование[11]

var  

282 пользователя проголосовало

У вас нет прав на голосование в этом опросе, или на просмотр результатов опроса. Пожалуйста, войдите или зарегистрируйтесь для голосования в опросе.

Рекомендованные сообщения

Не получается. Нужно просто хотябы .txt форматы скачать. Нафиг их в zip засовывать. Они с ошибками и половина не открывается. :(


moonfangtopich написал 29.08.2019 в 14:57:
У вас недостаточно широкий кругозор, пацаны

Я странствия этого еблана видел в покерных топанах, а потом в таверне - это один из самых безумных людей на форуме. Я искренне надеялся, что его зов о помощи останется незамеченным, но нет, нашелся доброволец и вот уже три страницы мы пожинаем плоды

Поделиться сообщением


Ссылка на сообщение
yellyex написал 9 минут назад:
... написал 11 минут назад:
yellyex написал 12 минут назад:
Arzanis написал 13 минут назад:

 

yellyex написал 34 минуты назад:

Не, чё то не то. Не всё скачивает.

 

Тебе же написали что только для txt написано.

А я не видел :)

В общем он на рандомной книге ошибку выдаёт. 

Ну корчое ещё раз спасибо.

скинь ошибку текстом а не скрином 

В общем он всё скачивает, а на рандомной книге выдаёт ошибку.

 


Traceback (most recent call last):
  File "C:/Users/User/Desktop/parcer.py", line 36, in <module>
    asyncio.run(get_books_links('https://royallib.com/genre/voennoe_delo/'))
  File "C:\Program Files\Python312\Lib\asyncio\runners.py", line 194, in run
    return runner.run(main)
  File "C:\Program Files\Python312\Lib\asyncio\runners.py", line 118, in run
    return self._loop.run_until_complete(task)
  File "C:\Program Files\Python312\Lib\asyncio\base_events.py", line 687, in run_until_complete
    return future.result()
  File "C:/Users/User/Desktop/parcer.py", line 14, in get_books_links
    await asyncio.gather(*tasks)
  File "C:/Users/User/Desktop/parcer.py", line 25, in download_book
    with open(f"{book_name}.zip", 'wb') as f:
OSError: [Errno 22] Invalid argument: 'iz_otchyota__3_vl_ginzburga_"1_ispolzovanie_Li6D_v_sloyke…".zip'

 



Эта хуйня (сайт) возвращает 200 "file not found", вместо 404. Поэтому падает. Проверяй вместо response.status == 200 еще и чтобы ответ не был "file not found"

 

... написал 7 минут назад:

на маке работает так что дальше сам...

Чет пиздишь. Как у тебя могла скачаться книга, которой нет на сайте


 

DB

59221730.png


Я - гений, ёпта

bfe7003be27e8e81ce6a7d2d8192e9ae.jpg


22


msg-93176-0-72842500-1438846470_thumb.jpg

Поделиться сообщением


Ссылка на сообщение

А я сам мудак. Это сам сайт их засовывает  :)

Сорян сорян.


moonfangtopich написал 29.08.2019 в 14:57:
У вас недостаточно широкий кругозор, пацаны

Я странствия этого еблана видел в покерных топанах, а потом в таверне - это один из самых безумных людей на форуме. Я искренне надеялся, что его зов о помощи останется незамеченным, но нет, нашелся доброволец и вот уже три страницы мы пожинаем плоды

Поделиться сообщением


Ссылка на сообщение
Arzanis написал 4 минуты назад:

Чет пиздишь. Как у тебя могла скачаться книга, которой нет на сайте

А я понял "open" работает принципиально по-разному на макоси и винде. Найс язык

yellyex понравилось это

 

DB

59221730.png


Я - гений, ёпта

bfe7003be27e8e81ce6a7d2d8192e9ae.jpg


22


msg-93176-0-72842500-1438846470_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Arzanis написал 4 минуты назад:
yellyex написал 16 минут назад:
... написал 17 минут назад:
yellyex написал 19 минут назад:
Arzanis написал 20 минут назад:

 

yellyex написал 41 минуту назад:

Не, чё то не то. Не всё скачивает.

 

Тебе же написали что только для txt написано.

А я не видел :)

В общем он на рандомной книге ошибку выдаёт. 

Ну корчое ещё раз спасибо.

скинь ошибку текстом а не скрином 

В общем он всё скачивает, а на рандомной книге выдаёт ошибку.

 



Traceback (most recent call last):
  File "C:/Users/User/Desktop/parcer.py", line 36, in <module>
    asyncio.run(get_books_links('https://royallib.com/genre/voennoe_delo/'))
  File "C:\Program Files\Python312\Lib\asyncio\runners.py", line 194, in run
    return runner.run(main)
  File "C:\Program Files\Python312\Lib\asyncio\runners.py", line 118, in run
    return self._loop.run_until_complete(task)
  File "C:\Program Files\Python312\Lib\asyncio\base_events.py", line 687, in run_until_complete
    return future.result()
  File "C:/Users/User/Desktop/parcer.py", line 14, in get_books_links
    await asyncio.gather(*tasks)
  File "C:/Users/User/Desktop/parcer.py", line 25, in download_book
    with open(f"{book_name}.zip", 'wb') as f:
OSError: [Errno 22] Invalid argument: 'iz_otchyota__3_vl_ginzburga_"1_ispolzovanie_Li6D_v_sloyke…".zip'

 



Эта хуйня (сайт) возвращает 200 "file not found", вместо 404. Поэтому падает. Проверяй вместо response.status == 200 еще и чтобы ответ не был "file not found"

 

... написал 13 минут назад:

на маке работает так что дальше сам...

Чет пиздишь. Как у тебя могла скачаться книга, которой нет на сайте

а все я понял 

файл сохраняется но по факту он пустой

надо проверки накручивать что книга существует и что книга есть в таком формате

тз не было так что имеем что имеем :jokerge:

Поделиться сообщением


Ссылка на сообщение
(изменено)

Скачал парсер с гитхаба для tululu.org и он не работает :prichina_tryaski::prichina_tryaski::prichina_tryaski::prichina_tryaski::prichina_tryaski:

https://github.com/GeorgyMaximov/tululu-parser


Изменено пользователем yellyex

moonfangtopich написал 29.08.2019 в 14:57:
У вас недостаточно широкий кругозор, пацаны

Я странствия этого еблана видел в покерных топанах, а потом в таверне - это один из самых безумных людей на форуме. Я искренне надеялся, что его зов о помощи останется незамеченным, но нет, нашелся доброволец и вот уже три страницы мы пожинаем плоды

Поделиться сообщением


Ссылка на сообщение
Arzanis написал 6 минут назад:
Arzanis написал 11 минут назад:

Чет пиздишь. Как у тебя могла скачаться книга, которой нет на сайте

А я понял "open" работает принципиально по-разному на макоси и винде. Найс язык

@yellyex крч макось разрешает создать файлы с кавычками, а винда нет. Так что на эскейпить кавычки (и еще мб какие-то символы). Как заэскепить имя файла на пайтоне - нагуглишь сам)


 

DB

59221730.png


Я - гений, ёпта

bfe7003be27e8e81ce6a7d2d8192e9ae.jpg


22


msg-93176-0-72842500-1438846470_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
yellyex написал 2 минуты назад:

Скачал парсер с гитхаба для tululu.org и он не работает :prichina_tryaski::prichina_tryaski::prichina_tryaski::prichina_tryaski::prichina_tryaski:

https://github.com/GeorgyMaximov/tululu-parser

 

идет выкачка всего контента на планете :corona:

Seledkin, scarppy, yellyex и 1 другому понравилось это

Поделиться сообщением


Ссылка на сообщение
... написал 4 минуты назад:
yellyex написал 7 минут назад:

Скачал парсер с гитхаба для tululu.org и он не работает :prichina_tryaski::prichina_tryaski::prichina_tryaski::prichina_tryaski::prichina_tryaski:

https://github.com/GeorgyMaximov/tululu-parser

 

идет выкачка всего контента на планете :corona:

Как его запустить-то? :) Через что? Через ярлык?


moonfangtopich написал 29.08.2019 в 14:57:
У вас недостаточно широкий кругозор, пацаны

Я странствия этого еблана видел в покерных топанах, а потом в таверне - это один из самых безумных людей на форуме. Я искренне надеялся, что его зов о помощи останется незамеченным, но нет, нашелся доброволец и вот уже три страницы мы пожинаем плоды

Поделиться сообщением


Ссылка на сообщение

Там в рид ми написано как. Через командную строку.


 

DB

59221730.png


Я - гений, ёпта

bfe7003be27e8e81ce6a7d2d8192e9ae.jpg


22


msg-93176-0-72842500-1438846470_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
yellyex написал 1 минуту назад:
... написал 6 минут назад:
yellyex написал 8 минут назад:

Скачал парсер с гитхаба для tululu.org и он не работает :prichina_tryaski::prichina_tryaski::prichina_tryaski::prichina_tryaski::prichina_tryaski:

https://github.com/GeorgyMaximov/tululu-parser

 

идет выкачка всего контента на планете :corona:

Как его запустить-то? :) Через что? Через ярлык?

git clone https://github.com/GeorgyMaximov/tululu-parser.git

cd tululu-parser

pip install -r requirements.txt

 

потом в зависимости от того что тебе надо сделать 

https://github.com/GeorgyMaximov/tululu-parser?tab=readme-ov-file#parse_tululu_categorypy

Поделиться сообщением


Ссылка на сообщение

Кому нужны деньги с работы, когда можно собирать лайки с йелекса на ПД

scarppy понравилось это

 

DB

59221730.png


Я - гений, ёпта

bfe7003be27e8e81ce6a7d2d8192e9ae.jpg


22


msg-93176-0-72842500-1438846470_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Arzanis написал 23 минуты назад:
Arzanis написал 30 минут назад:
Arzanis написал 36 минут назад:

Чет пиздишь. Как у тебя могла скачаться книга, которой нет на сайте

А я понял "open" работает принципиально по-разному на макоси и винде. Найс язык

@yellyex крч макось разрешает создать файлы с кавычками, а винда нет. Так что на эскейпить кавычки (и еще мб какие-то символы). Как заэскепить имя файла на пайтоне - нагуглишь сам)

Там еще может быть такая хуйня, что в f-стринг одинаковые кавычки (‘’ ‘’ ‘’ ‘’) друг в друга только с питона 3.12 можно вставлять, в предыдущих версиях можно только двойные в одиночные (‘ ‘’ ‘’ ‘) и наоборот. Так что мб тут проблема что на маке новый питон стоит и поэтому все работает, а у елекса прошлая версия <3.12.

Arzanis понравилось это

Поделиться сообщением


Ссылка на сообщение
RedThunder458 написал 3 минуты назад:
Arzanis написал 31 минуту назад:
Arzanis написал 38 минут назад:
Arzanis написал 44 минуты назад:

Чет пиздишь. Как у тебя могла скачаться книга, которой нет на сайте

А я понял "open" работает принципиально по-разному на макоси и винде. Найс язык

@yellyex крч макось разрешает создать файлы с кавычками, а винда нет. Так что на эскейпить кавычки (и еще мб какие-то символы). Как заэскепить имя файла на пайтоне - нагуглишь сам)

Там еще может быть такая хуйня, что в f-стринг одинаковые кавычки (‘’ ‘’ ‘’ ‘’) друг в друга только с питона 3.12 можно вставлять, в предыдущих версиях можно только двойные в одиночные (‘ ‘’ ‘’ ‘) и наоборот. Так что мб тут проблема что на маке новый питон стоит и поэтому все работает, а у елекса прошлая версия <3.12.

у меня 3.11 так что хз 

Поделиться сообщением


Ссылка на сообщение
RedThunder458 написал 3 часа назад:

Кстати, по поводу парсеров, кто-нибудь шарит, если парсить сайт, где все работает на джаваскрипте (динамический контент с постоянным обновлением), который выдает почти пустой html при запросе, есть ли более оптимальный метод для парсинга чем через селениум открывать браузер и читать всю хуйню?

посмотреть как жс дергает апи и дернуть апи самому

Just.Doit и RedThunder458 понравилось это

Торжество разума в том, чтобы уживаться с теми, у кого этого разума нет. Вольтер.
Чтобы хорошо высыпаться, нужно спать 8 часов в день. И еще столько же ночью.

Поделиться сообщением


Ссылка на сообщение
Kant написал 33 минуты назад:
RedThunder458 написал 3 часа назад:

Кстати, по поводу парсеров, кто-нибудь шарит, если парсить сайт, где все работает на джаваскрипте (динамический контент с постоянным обновлением), который выдает почти пустой html при запросе, есть ли более оптимальный метод для парсинга чем через селениум открывать браузер и читать всю хуйню?

посмотреть как жс дергает апи и дернуть апи самому

а там проверка на ботов и придётся искать способы обхода

 

так и становятся профессиональным скрапером или как там

Поделиться сообщением


Ссылка на сообщение
(изменено)
RedThunder458 написал 4 часа назад:

Кстати, по поводу парсеров, кто-нибудь шарит, если парсить сайт, где все работает на джаваскрипте (динамический контент с постоянным обновлением), который выдает почти пустой html при запросе, есть ли более оптимальный метод для парсинга чем через селениум открывать браузер и читать всю хуйню?

мб подход как с гуглом когда сайт сам предоставляет специальные страницы которые парсятся роботом, и как я понял делает обычно это через фреймворки и сервер сайд рендеринг

Arzanis написал 3 часа назад:

когда военкоматы надо было спарсить

нахуя :O


Изменено пользователем Just.Doit

 

очень крутые котейки

RqvSzvr.png


Кому-то пизды дал - нужно сделать скрин обязательно. (с) Solo

Поделиться сообщением


Ссылка на сообщение

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Восстановить форматирование

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

Загрузка...

×
×
  • Создать...