Вариант для распечатки |
Пред. тема | След. тема | ||
| Форум Разговоры, обсуждение новостей | |||
|---|---|---|---|
| Изначальное сообщение | [ Отслеживать ] | ||
| "Раздел полезных советов: Борьба с web-ботами через запрет HTTP/1.1" | +/– | |
| Сообщение от auto_tips (??), 09-Мрт-26, 19:01 | ||
Как один из вариантов борьбы с AI-скрапперами, создающими огромную паразитную нагрузку на сервер, [[https://sheep.horse/2026/3/blocking_http1.1_-_some_results.html предложено]] ограничить доступ к сайту по протоколу HTTP/2 и полностью отключить поддержку HTTP/1.0 и HTTP/1.1. Логика подобного решения в том, что все современные браузеры поддерживают HTTP/2, а боты почти всегда обращаются к сайтам по HTTP/1.1 и пока не пытаются использовать HTTP/2 в случае невозможности отправить запрос на HTTP/1.1. | ||
| Ответить | Правка | Cообщить модератору | ||
| Оглавление |
| Сообщения | [Сортировка по ответам | RSS] |
| 1. Сообщение от Аноним (1), 09-Мрт-26, 19:01 | +3 +/– | |
Так себе идея, не учитывающая много исключений. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #2 | ||
| 2. Сообщение от Гость (??), 09-Мрт-26, 20:58 | +1 +/– | |
С ботами из сети Tencent как? оттуда валится столько запросов и входящего трафика, что лучше из банить до http сервера. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #1 Ответы: #4, #14 | ||
3.
Сообщение от S_Paul (??), 09-Мрт-26, 21:55
| +1 +/– | |
Вложенные "if"'ы наверное можно map'ами сделать. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 4. Сообщение от Аноним (1), 10-Мрт-26, 06:52 | +3 +/– | |
С ними проще - можно банить прям подсетями. Брать из BGP списки подсетей принадлежащие AS Tencent, Alibaba, Huawei cloud и пр. и закидывать пачками в ipset/netfilter. Простенький скрипт в кроне раз в неделю | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #2 | ||
| 5. Сообщение от Аноним (5), 11-Мрт-26, 08:42 | +1 +/– | |
Все нормальные скрейперы давно мимикрируют под браузер не только заголовком user-agent, но и протоколами. Продвинутые же скрейперы используют настоящий браузер. "Памяти всегда докупить можно (тм)". Сейчас у смузихлёбов на гитхабе тенденция - вообще всё делать через Microsoft Playwright (который через WebDriver работает с живой страницей), и не заморачиваться с реверсингом и кастомными скрейперами. Тьфу. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #6, #13 | ||
| 6. Сообщение от Аноним (5), 11-Мрт-26, 08:44 | +/– | |
Вообще всё - это когда этот playwright вообще ни к селу ни к месту. Но у Американских Высокооплачиваемых Скрейперописателей рабочее время слишком дорого для этого, дешевле оперативки докупить, оперативка ведь один раз покупается, а скрейпер писать - каждый раз надо. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #5 Ответы: #8 | ||
| 7. Сообщение от Аноним (7), 12-Мрт-26, 16:06 | +/– | |
скоро боты поразмыслят и заявят о дискриминации. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #12 | ||
| 8. Сообщение от Аноним (8), 12-Мрт-26, 17:50 | +/– | |
Меня как-то с работы попёрли за то, что я долго писал скрейпер с обвязкой на C и JS и полной автоматизацией. Джун, который за меня переписал другой мой скрейпер на вебдрайвере, который до этого был написан через реверсинг приложения, по шапке не получил. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #6 | ||
| 9. Сообщение от Gremlin_Rage (ok), 12-Мрт-26, 22:49 | +/– | |
Гуглбот фигачит данные в Гемини, а в РФ он не подсказывает | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #10 | ||
| 10. Сообщение от Аноним (10), 13-Мрт-26, 10:01 | +/– | |
AI Overviews в поиске и google.com/ai в РФ работают. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #9 | ||
| 11. Сообщение от Аноним (11), 15-Мрт-26, 08:55 | –1 +/– | |
> Пример правил для http-сервера Caddy, возвращающих клиенту | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 12. Сообщение от Аноним (-), 15-Мрт-26, 08:56 | +/– | |
> скоро боты поразмыслят и заявят о дискриминации. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #7 | ||
| 13. Сообщение от Аноним (14), 15-Мрт-26, 09:06 | +/– | |
> Все нормальные скрейперы давно мимикрируют под браузер не только заголовком user-agent, | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #5 Ответы: #15 | ||
| 14. Сообщение от Аноним (14), 15-Мрт-26, 09:09 | +/– | |
> С ботами из сети Tencent как? оттуда валится столько запросов и входящего | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #2 | ||
| 15. Сообщение от Аноним (15), 17-Мрт-26, 14:40 | +/– | |
Это не наш вебдрайвер, вебдрайвер изначально вообще создавался как средство для тестирования самого браузера и веб-сайтов. Я помню времена, когда вебдрайвера вообще не было, а было расширение для Firefox, и к нему через сокет и клиентскую либу цеплялось, но уже не помню, как это расширение называлось, но тоже было для тестирования. Но когда файрфокс отжирает малую долю от инференса модели, считай что крутить страницу на файрфоксе, или крутить мегаоптимизированный скрипт - разницы никакой. Снявши голову по волосам не плачат, а те, кто модели инферят - именно голову сняли, и искусственную приставили. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #13 | ||
|
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
|
Закладки на сайте Проследить за страницей |
Created 1996-2026 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |