<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: В БД для обучения AI-моделей Common Crawl выявлено около 12 тысяч API-ключей и паролей</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html</link>
    <description>Исследователи из компании Truffle Security опубликовали результаты анализа публичного набора данных Common Crawl, используемого при обучении больших языковых моделей  (например, DeepSeek). В исследовании использован декабрьский архив Common Crawl, включающий 400 терабайтов данных с содержимым  2.67 миллиардов web-страниц...&lt;br&gt;&lt;br&gt;Подробнее: https://www.opennet.ru/opennews/art.shtml?num=62823&lt;br&gt;</description>

<item>
    <title>В БД для обучения AI-моделей Common Crawl выявлено около 12 ... (bdrbt)</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html#66</link>
    <pubDate>Sat, 08 Mar 2025 04:32:54 GMT</pubDate>
    <description>&amp;gt; которые были указаны прямо в HTML-формах или JavaScript-коде, вместо использования переменных окружения на серверной стороне.&lt;br&gt;&lt;br&gt;Тот самый момент, когда фронтендеры объявляют себя фулстеками. Такому только скажи, что нельзя палить ключи во фронте и надо как минимум использовать переменные окружения, так он вкорячит ещё 100500 npm-модулей сомнительного происхождения, для &quot;зашЫфрованных переменных окружения&quot;, которые при сборке всего этого rect/vue/и т.д. всё равно захардкодятся в публичные жабоскрипты.&lt;br&gt;</description>
</item>

<item>
    <title>В БД для обучения AI-моделей Common Crawl выявлено около 12 ... (тоже Аноним)</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html#65</link>
    <pubDate>Thu, 06 Mar 2025 05:47:47 GMT</pubDate>
    <description>Я понимаю, что нет смысла прятать то, что не имеет ценности.&lt;br&gt;</description>
</item>

<item>
    <title>В БД для обучения AI-моделей Common Crawl выявлено около 12 ... (Аноним)</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html#64</link>
    <pubDate>Wed, 05 Mar 2025 19:38:42 GMT</pubDate>
    <description>Ну да.&lt;br&gt;Можно конечно было написать на php, но ты же понимаешь, что тогда выполнятся он будет на сервере, а не в браузере миллионов хомячков.&lt;br&gt;</description>
</item>

<item>
    <title>В БД для обучения AI-моделей Common Crawl выявлено около 12 ... (Аноним)</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html#59</link>
    <pubDate>Tue, 04 Mar 2025 16:53:46 GMT</pubDate>
    <description>Да, где то мелькал прототип проекта для размещения своих данных на 100500 чужих поломатых хостингах, шифруем, рубим на небольшие чанки и раскладываем по N (если N кажется мало, то можно M или даже Q*2) копий вот в такие вот S3 и гугл доксы. ну пропадёт десяток-другой, 80+&#037; останется.&lt;br&gt;&lt;br&gt;Дело только в автоматизации регулярной проверки &quot;выбывших&quot;, поиска новых &quot;жертв&quot; и восстановлении кворума.&lt;br&gt;&lt;br&gt;Сверху обвязку в фузе, и пиши-читай.. писать да, не быстро.. но при наличии буфера на запись может оказаться и ничего.&lt;br&gt;&lt;br&gt;Главное в Великобританиию не писать.. а то вроде им там законом предписано умереть от угрызений совести, если они не смогут расшифровать данные со своего сервиса. Не хорошо&apos;с получится...&lt;br&gt;</description>
</item>

<item>
    <title>В БД для обучения AI-моделей Common Crawl выявлено около 12 ... (Аноним)</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html#57</link>
    <pubDate>Tue, 04 Mar 2025 16:11:02 GMT</pubDate>
    <description>Т.е. я пока все эти ИИ технологии отношу к цифровому оружию. Как это по другому назвать ещё? Я имею в виду утечку ключей с паролями. Многие пеняют на программистов. А что будет когда оно само будет не хуже некоторых специалистов по заходу туда куда нельзя будет заходить? Ну и повторю то что некоторых наверно уже задолбало - веб устарел, технологии будут меняться и как минимум решение в инкапсуляции сети, из-за чего неизбежно будут развиваться новые протоколы передачи данных. Рано или поздно придётся сказать прощай DNS, прощай IP. А вместо них пока ничего толкового нет. Если кто знает лучше решение и своё предположение как это в итоге будут решать в (ближайшем) будущем - напишите. Я лично пока лучшего решения не вижу, т.е. решение проблемы неизбежно, а лучшего варианта никто не предложил кроме как минусовать. Т.е. проблема вероятнее всего многим понятна, но решения нет.&lt;br&gt;</description>
</item>

<item>
    <title>В БД для обучения AI-моделей Common Crawl выявлено около 12 ... (Аноним)</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html#56</link>
    <pubDate>Tue, 04 Mar 2025 14:48:31 GMT</pubDate>
    <description>Дело не в том что-то кто-то ленится. Дело в том что прибыль получают только самые быстрые :(&lt;br&gt;</description>
</item>

<item>
    <title>В БД для обучения AI-моделей Common Crawl выявлено около 12 ... (Аноним)</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html#55</link>
    <pubDate>Tue, 04 Mar 2025 14:44:16 GMT</pubDate>
    <description>Он от качества этой информации просто отупеет и по истечению времени вы его уже не узнаете. :)&lt;br&gt;</description>
</item>

<item>
    <title>В БД для обучения AI-моделей Common Crawl выявлено около 12 ... (Аноним)</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html#54</link>
    <pubDate>Tue, 04 Mar 2025 14:39:18 GMT</pubDate>
    <description>Всё это было понятно но все сервисы и особенно поиск каждый человек не может позволить на своих серверах держать. :(&lt;br&gt;</description>
</item>

<item>
    <title>В БД для обучения AI-моделей Common Crawl выявлено около 12 ... (Аноним)</title>
    <link>https://opennet.me/openforum/vsluhforumID3/136180.html#53</link>
    <pubDate>Tue, 04 Mar 2025 14:15:27 GMT</pubDate>
    <description>Так они вам и скажут, на сколько денег их &quot;знакомые&quot; зашортили стоки, ждите.&lt;br&gt;</description>
</item>

</channel>
</rss>
