The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Google открыл код AI-системы Magika для определения типа содержимого файлов"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Google открыл код AI-системы Magika для определения типа содержимого файлов"  +/
Сообщение от opennews (??), 16-Фев-24, 10:45 
Компания Google объявила об открытии кода проекта Magika, предназначенного для определения типа содержимого на основе анализа имеющихся в файле данных. Magika может точно определять в содержимом используемые языки программирования, методы сжатия, установочные пакеты, исполняемый код, виды разметки, форматы звука, видео, документов и изображений. Связанный с проектом инструментарий и готовая модель машинного обучения опубликованы под лицензией Apache 2.0...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=60611

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

1. Сообщение от Аноним (1), 16-Фев-24, 10:45   +22 +/
Это как раз та область где просто нужна база магических слов (примерно как и MIME) и никакого машинного обучения не нужно.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #59, #71, #81, #153, #161

3. Сообщение от Alladin (?), 16-Фев-24, 10:45   +1 +/
binwalk отдыхает?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #45

6. Сообщение от Аноним (6), 16-Фев-24, 10:47   +/
У ibmagic емнип под сотни мс на каждый файл выходило, так что "5-6 мс" не так уж плохо.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #140, #166

8. Сообщение от pelmaniac (?), 16-Фев-24, 10:48   +2 +/
Подавляющему большинству не нужно проверять мульёны файлов с сек.
Оно хоть лучше apache tika? Которое умеет не только тип определить, но и text вытащить.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #14, #42

14. Сообщение от Аноним (6), 16-Фев-24, 10:53   –2 +/
Ну вот открываешь ты файловый менеджер… А, нет, вот открывает подавляющее меньшинство файловый менеджер, и хочет видеть в нём распознавание по типу файла, ну, чтобы не открывались видеофайлы в текстовом редакторе. Вполне типичная задача. Если текущие решения не способны обеспечить надёжное распознавание, самое время их заменить.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8 Ответы: #19

18. Сообщение от 12yoexpert (ok), 16-Фев-24, 10:57   +5 +/
а я, старый, file пользуюсь
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #34, #95

19. Сообщение от Уть (?), 16-Фев-24, 10:59   +10 +/
Говорят, есть утерянная технология древней цивилизации, называется "расширение", позволяет идентифицировать тип файла, просто взглянув на него, и ваще что-то невероятное - запускать нужную программу для открытия файла автоматически!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #14 Ответы: #21, #26, #37, #38, #128

20. Сообщение от garrick (?), 16-Фев-24, 11:00   +1 +/
А теперь любое ПО можно AI-системой называть?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #25

21. Сообщение от Аноним (6), 16-Фев-24, 11:03   +/
Так это только в досе было и в некоторой мере в венде, тогда просто не было вариантов. Сегодня уже как-то неактуально. Не вспоминая уж про любителей переименовывать jpg в png и наоборот (а это разные либы).
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #19 Ответы: #35, #185

24. Сообщение от Аноним (24), 16-Фев-24, 11:09   –3 +/
Очень хорошая вешь, давно хотел сам такую работу сделать. Но у меня ни дейтасетов, ни железа, ни глубокого понимания работы нейросетей нет.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #27

25. Сообщение от Аноним (6), 16-Фев-24, 11:10   +2 +/
Претренированная модель звучит не так красиво, а так ml в различных представлениях много где встречается. Проблема в том, что доверять им нельзя по факту (при этом, поставщик вполне может успешно решать свои задачи, но это его задачи и его модели, тренированные на его датасетах).
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #20

26. Сообщение от Аноним (26), 16-Фев-24, 11:11   +/
Сейчас система сама определяет что ты и как открываешь пример тот же мак.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #19

27. Сообщение от Аноним (26), 16-Фев-24, 11:13   +/
Ни применения потому что ты итак знаешь что и как открывать, естественным интеллектом.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #24 Ответы: #36

30. Сообщение от Аноним (30), 16-Фев-24, 11:19   +5 +/
Подсунул бинарь с float-ами, а оно его вообще никак не распознало - размазало по 1 проценту на все типы файлов, лол
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #33

32. Сообщение от Аноним (24), 16-Фев-24, 11:20   +1 +/
>[tool.poetry]
>name = "assets-generation"

Они там совсем крышей поехали со своими Poetry и  venvами. Впрочем, для гуглага этот идиотизм характерен, те же Bazel (которым собирают почти все проекты гуглага, котгрые надо защитить от грязных рук сообщества, чтобы палки в колёса не ставили) и сборочная система андроида следуют тому же паттерну

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #72, #117, #158

33. Сообщение от 12yoexpert (ok), 16-Фев-24, 11:20   +1 +/
ты б ещё бинарь с байтами подсунул
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #30 Ответы: #39

34. Сообщение от Аноним (134), 16-Фев-24, 11:21   +/
Даже старый ДОСовский FA был лучше, чем file.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #18 Ответы: #87

35. Сообщение от Аноним (134), 16-Фев-24, 11:23   +/
До сих пор такое с завидной регулярностью встречается.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #21 Ответы: #107

36. Сообщение от Аноним (24), 16-Фев-24, 11:23   +/
Мне для других целей. И по-видимому вообще другое. Подробности плана знают немногие люди, тут светить не буду, а то ещё кто-нибудь вместо меня сделает.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #27 Ответы: #82, #145

37. Сообщение от Аноним (134), 16-Фев-24, 11:23   +2 +/
Отчёт.doc.exe, да, молодость…
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #19

38. Сообщение от Аноним (134), 16-Фев-24, 11:25   +1 +/
А теперь представь: десяток тысяч файлов, вытащенных с поломанной файловой системы, с именами вида file0000.chk (или как их восстанавливающий софт назовёт), очень полезно тут расширение, да.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #19 Ответы: #119

39. Сообщение от Аноним (134), 16-Фев-24, 11:26   +1 +/
А если с битами!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #33 Ответы: #96

40. Сообщение от Аноним (40), 16-Фев-24, 11:27   +4 +/
Вероятно эта штука нужна для того, чтобы гугл сканировал файлы на гугл-дисках пользователей. Например, искать там что-то незаконное или то, что то, что их интересует.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #52, #56

42. Сообщение от Аноним (134), 16-Фев-24, 11:27   +/
Подавляющему большинству оно вообще не нужно. А это для того, кому нужно.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8

45. Сообщение от EuPhobos (ok), 16-Фев-24, 11:28   +15 +/
binwalk хорош тем, что показывает структуру бинарника, с адресами где какие данные начинаются и какой длины.

upd: протестировал, магика даже рядом не стоит с binwalk.

Сдампленный бинарник из микросхемы SPI купленный на алишке:
Магика: - это ISO cd-rom!
Binwalk: - это суп из:
LZMA compressed data,
uImage header, header size: 64 bytes,
Linux kernel ARM boot executable zImage
Squashfs filesystem, little endian, created: 2019-07-18 13:59:01
Zlib compressed data,
Linux, CPU: ARM, image type: OS Kernel Image, compression type: none, image name: "Linux-3.10.90"


С адресами и размерами блоков.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3 Ответы: #105, #114

49. Сообщение от Аноним (24), 16-Фев-24, 11:33   +/
>import dotenv

Ещё один признак поехатости. Какие-то придурки придумали хранить "переменные окружения" в локальной папке в специальном файле вместо использования механизмов ОС и оболочки для переменных окружения. А гугл — заюзал это дерьмо.

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #57, #73

51. Сообщение от Аноним (24), 16-Фев-24, 11:34   +/
>from magika import magika, prediction_mode

Кто-то либо не умеет в импорт через точку, либо не осилил DRY-принцип.

Ответить | Правка | Наверх | Cообщить модератору

52. Сообщение от Аноним (52), 16-Фев-24, 11:35   +2 +/
да, искать незаконное они умеют
http://opennet.ru/opennews/art.shtml?num=56574
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #40 Ответы: #184

54. Сообщение от Аноним (24), 16-Фев-24, 11:36   –1 +/
>Magika = magika.Magika

Также кто-то не научился правильно пользоваться from ... import

Ответить | Правка | Наверх | Cообщить модератору

56. Сообщение от Аноним (56), 16-Фев-24, 11:40   +1 +/
Незаконное их если и волнует, то в последнюю очередь.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #40

57. Сообщение от Аноним (56), 16-Фев-24, 11:41   +/
У виндузятников нет механизмов ОС.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #49 Ответы: #65, #70

58. Сообщение от Аноним (24), 16-Фев-24, 11:43   +1 +/
>   for path in tqdm(paths, disable=self._disable_progress_bar):

Они там долбанулись в БИБЛИОТЕКЕ для использования в программах использовать TQDM (либу для рисовки прогрессбара в stdout, а также GUI-прогрессбаров).

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #74

59. Сообщение от test (??), 16-Фев-24, 11:47   –1 +/
каких еще слов ? Вроде в конце имени файла есть расширение которое ...
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #93, #108, #109, #113

60. Сообщение от Аноним (24), 16-Фев-24, 11:48   +/
>def _extract_features_from_path(
>def _extract_features_from_bytes(
>почти одинаковый код

Кто-то не умеет в mmap.

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #142

61. Сообщение от Аноним (61), 16-Фев-24, 11:49   +/
Файлы ресурсов из игр сабж может потрошить? Почти у каждого такого файла своя неповторимая структура.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #63

63. Сообщение от Аноним (24), 16-Фев-24, 11:55   +/
Нет, не умеет. Извлекаются блоки байтов из начала файла, конца файла и середины. На них обцчается нейронка. По-видимому выдаёт только классы. Просто крайне узкоспециализированный кусок говна.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #61

65. Сообщение от Аноним (24), 16-Фев-24, 11:58   +1 +/
>set A=b

А это что?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #57

66. Сообщение от Анонист (?), 16-Фев-24, 12:03   +3 +/
Что-то мне сдаётся, что для этой задачи AI - абсолютный оверинжиниринг. Неуж-то бы дожили то того, что теперь вместо фреймворков везде на каждый пук будут пихать AI?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #67, #104

67. Сообщение от Аноним (24), 16-Фев-24, 12:08   –3 +/
Для моей задачи ИИ никак не оверинжиниринг, а вообще единственный вариант.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66 Ответы: #100

69. Сообщение от Аноним (24), 16-Фев-24, 12:11   +/
Как всегда в репертуаре гугла — ради нескольких свистоперделок требуется одна из наиболее свежих версий питона.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #75, #92

70. Сообщение от n00by (ok), 16-Фев-24, 12:14   –1 +/
Читать документацию, похоже, умеют одни виндузятники.

Чтобы программно добавить или изменить системные переменные среды, добавьте их в раздел реестра HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\Session Manager\Environment

https://learn.microsoft.com/ru-ru/windows/win32/procthread/e...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #57 Ответы: #118

71. Сообщение от Пряник (?), 16-Фев-24, 12:15   +/
Ну почему, для фильтрации писем - самое то.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1

72. Сообщение от Пряник (?), 16-Фев-24, 12:17   +/
А как ты управляешь virtualenv'ами? Вручную?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #32 Ответы: #78

73. Сообщение от Пряник (?), 16-Фев-24, 12:18   +2 +/
Какого ты плохого мнения об авторах Bash. Зачем они хранят переменные окружения в bashrc?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #49 Ответы: #77

74. Сообщение от Пряник (?), 16-Фев-24, 12:20   +1 +/
Надо было Rich сразу импортировать. У него звёзд в гитхабе больше.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #58

75. Сообщение от Пряник (?), 16-Фев-24, 12:22   +1 +/
Слазь уже со второй версии 😂
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #69 Ответы: #80

76. Сообщение от n00by (ok), 16-Фев-24, 12:30   –3 +/
Зачем это на VirusTotal? Гугл хочет решать, кто из вендоров получит образец?
Ответить | Правка | Наверх | Cообщить модератору

77. Сообщение от Аноним (24), 16-Фев-24, 12:31   +/
bashrc - ъто стандартный способ, .env - это васяноподелка.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #73 Ответы: #139

78. Сообщение от Аноним (24), 16-Фев-24, 12:32   +/
Я говно не кушаю. venv использую только для тестирования бутстрапа своего пакетного менеджера с нуля при нуле установленных пакетов.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #72 Ответы: #88

80. Сообщение от Аноним (24), 16-Фев-24, 12:35   –1 +/
Я никогда не сидел на второй версии и мой софт её никогда не поддерживал.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #75

81. Сообщение от anonymos (?), 16-Фев-24, 12:57   +2 +/
Иногда, лучше жевать - чем говорить!

~ $ echo "Hello woodpecker" > test.txt
~ $ rar a test.rar test.txt
~ $ cat image.jpg test.rar > result.rar # Что получится ?
~ $ mv result.rar result.img # Что получится ?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #83, #94

82. Сообщение от Аноним (82), 16-Фев-24, 13:00   +/
> кто-нибудь вместо меня сделает

Что значит "вместо меня"? Судя по вашему комментарию, вы это делать не собираетесь, так как у вас ничего нет.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #36 Ответы: #85

83. Сообщение от timur.davletshin (ok), 16-Фев-24, 13:10   +3 +/
Иногда лучше начать с изучения пунктуации.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #81

85. Сообщение от Аноним (85), 16-Фев-24, 13:12   +/
Ну собираюсь, но когда-нибудь, когда необходимые ресурсы, знание и финансирование будут. Моя идея на порядки круче чем то, что тут сделали.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #82 Ответы: #89

86. Сообщение от Аноним (87), 16-Фев-24, 13:14   +1 +/
Посмотрел список "116 типов данных" по ссылке: какой-то особой экзотики не бросилось в глаза, заметная часть из них однозначно детектится по сигнатуре/заголовку.
Когда-то писал приблуду для проверки типов бинарных файлов, для распространённых форматов зачастую хватало прочитать 8 байт, для некоторых форматов понадобилось побольше, до 16 байт, и только в одном случае 30.
Вот с текстовыми посложнее, это да, хотя и тут есть тот же шебанг, теги XML и HTML.
Ответить | Правка | Наверх | Cообщить модератору

87. Сообщение от Аноним (87), 16-Фев-24, 13:17   +/
Количество типов файлов несравнимо.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #34

88. Сообщение от Пряник (?), 16-Фев-24, 13:19   +/
[quote]для тестирования бутстрапа своего велосипеда[/quote]

я поправил

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #78 Ответы: #91

89. Сообщение от Аноним (6), 16-Фев-24, 13:19   +/
Лучше подумай, как сделать дешевле. Круче никому не интересно, надо эффективнее.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #85 Ответы: #90

90. Сообщение от Аноним (85), 16-Фев-24, 13:30   +/
То, что я хочу сделать, для моего применения и есть эффективнее.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #89 Ответы: #121

91. Сообщение от Аноним (85), 16-Фев-24, 13:31   +/
Любой де-факто стандарт был когда-то велосипедом.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #88

92. Сообщение от Аноним (6), 16-Фев-24, 13:33   +1 +/
Вполне законно, никто не будет писать на доисторической версии по своей воле. Тем более, в случае с питоном, существует только последняя версия. За последние лет 10 проблемы совместимости были практически только с асинхронным кодом и кривыми биндингами, поэтому лично я не вижу ни одной причины поддерживать копролиты.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #69 Ответы: #102

93. Сообщение от Аноним (93), 16-Фев-24, 13:34   +8 +/
Которое не всегда есть и не всегда однозначно. Вот, например, .txt - это и просто текстом может быть, и конфигом cmake может оказаться.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #59 Ответы: #110

94. Сообщение от Аноним (93), 16-Фев-24, 13:41   +2 +/
Архивируешь в Линуксе RAR'ом? Фууу... фиии. Есть же открытый 7zip.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #81 Ответы: #106, #120, #135

95. Сообщение от Вованemail (??), 16-Фев-24, 13:50   +1 +/
Ха, тут ещё про TrID можно вспомнить.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #18

96. Сообщение от Аноним (93), 16-Фев-24, 13:51   +1 +/
Распознал бы как бейсбольные_биты.jpg
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #39 Ответы: #116

100. Сообщение от Аноним (100), 16-Фев-24, 13:53   +/
Если бы сейчас не было распространения нейросетей, а ваша задача стояла, то как бы вы поступили? Сразу сдались бы?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #67 Ответы: #103

102. Сообщение от Аноним (85), 16-Фев-24, 13:54   +/
Да там и по остальным признакам видно, что авторы халтурят.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #92 Ответы: #112

103. Сообщение от Аноним (85), 16-Фев-24, 13:56   +/
Делал бы как и раньше, и как и сейчас делаю.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #100 Ответы: #141

104. Сообщение от Quad Romb (ok), 16-Фев-24, 14:00   +/
Типов файлов очень много - врукопашную умаешься правила на все писать.
И каждый год количество этих типов подрастает.
Так что если такой классификатор ресурсов ест немного, то имеет право на жизнь.

Но, думаю следующим этапом будет автоматизированное создание вот по таким обученными сетям классификаторов на основе быстрых деревьев.
Потому что главная проблема в этих штуках, что их никак не заставишь явно размотать, на основе чего они отнесли объект к тому или иному классу. Да, и корректировать поведение деревянного классификатора гораздо-гораздо легче.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66

105. Сообщение от Аноним (-), 16-Фев-24, 14:13   +2 +/
> Сдампленный бинарник из микросхемы SPI купленный на алишке:
> Магика: - это ISO cd-rom!

А классные у вас там на алиэкспрессе сидиромы то :)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #45

106. Сообщение от Аноним (106), 16-Фев-24, 14:28   +/
Винрар столь данных с тебя собирает при приобретении разрешения, что чисто из чуйства противоречия все должны использовать консольный )
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #94

107. Сообщение от Аноним (106), 16-Фев-24, 14:29   +/
В Линукс?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #35 Ответы: #136

108. Сообщение от чатжпт (?), 16-Фев-24, 15:05   +9 +/
Т.е. что конвертнуть pdf-книгу в фильм надо просто переименовать файл в m4v? Ну ок
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #59 Ответы: #111, #129, #165

109. Сообщение от чатжпт (?), 16-Фев-24, 15:10   +1 +/
Т.е. что конвертнуть pdf-книгу в фильм надо просто переименовать файл в m4v? Ну ок
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #59

110. Сообщение от test (??), 16-Фев-24, 15:13   +/
Как будтто .mc файл это не текст.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #93

111. Сообщение от test (??), 16-Фев-24, 15:14   –2 +/
Это тут причем ? Не давай расширения от балды и все будет нормально.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #108 Ответы: #155, #163

112. Сообщение от Аноним (6), 16-Фев-24, 15:17   +/
Вроде, ничего криминального. Ну poetry с ruff и всё остальное вряд ли, но имеют право.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #102 Ответы: #152

113. Сообщение от Аноним (113), 16-Фев-24, 15:22   +7 +/
Всегда было интересно, зачем люди, ничего кроме винды не видевшие, ходят сюда?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #59 Ответы: #127

114. Сообщение от похнапоха. (?), 16-Фев-24, 15:22   –2 +/
Неплохой результат. Нейронки вообще крайне полезная вещь, но иногда её пихают не туда куда надо, например в зубную щетку, которая "научилась" выключаться после минуты использования, ибо у меня нет времени и желания утром спеша на работу, тратить больше времени на чистку, но когда мне действительно надо почистить больше минуты, это выключение раздражает, черт побери, мне не лень коснуться пальцем кнопки выключения тогда, когда МНЕ НАДО, а не тогда, когда "умная" счетка считает это нужным, типа "научившись"!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #45 Ответы: #176

115. Сообщение от Вы забыли заполнить поле Name (?), 16-Фев-24, 15:26   –1 +/
Лучшее расширение для гуглопчты или драйва— это зашифрованный архив tar.gpg.
Ответить | Правка | Наверх | Cообщить модератору

116. Сообщение от Аноним (-), 16-Фев-24, 15:40   +/
> Распознал бы как бейсбольные_биты.jpg

У них в ассортименте вроде только пожарные гидранты, школьные автобусы, переходы и велосипеды. Ну вот такой странный мир у гугла - состоит из вот этого вот. Бейсбольных бит в мире гугла не существует.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #96 Ответы: #181

117. Сообщение от Аноним (-), 16-Фев-24, 15:42   +/
> Они там совсем крышей поехали со своими Poetry и  venvами.

Он художник^W, он поэт, он так видит. Хотя реально за@#$ли господа из гуглы тянущие свой местечковый шитец в котором кроме них никто не рубит. Смысл в опенсорс такое вываливать - около плинтуса.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #32 Ответы: #148

118. Сообщение от Аноним (-), 16-Фев-24, 15:44   +1 +/
> добавьте их в раздел реестра
> HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\Session Manager\Environment

Виндовс очень дружественная к пользователям система, кули...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #70 Ответы: #138, #174

119. Сообщение от похнапоха. (?), 16-Фев-24, 15:46   +1 +/
Для десятков тысяч файлов нужно использовать нормальные ФС, и нормальные стораджа, тогда после проверки условным fsck помятой ФС не будут появлятся подобные файлы...
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #38 Ответы: #137

120. Сообщение от pfg21email (ok), 16-Фев-24, 15:48   +/
если зреть в корень, то в рар5 формате есть поддержка unix атрибутов файлов, неполная чтоль жаль, без спец.файлов, но чтото есть.    
в исходниках 7zip же нет ничего кроме винды :)    
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #94 Ответы: #126, #182

121. Сообщение от Аноним (-), 16-Фев-24, 15:49   +/
> То, что я хочу сделать, для моего применения и есть эффективнее.

Ну, если только твоего - тогда тебе это и оплачивать, очевидно.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #90

126. Сообщение от Аноним (126), 16-Фев-24, 16:33   +1 +/
*.tar.7z
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #120 Ответы: #133, #191

127. Сообщение от Qq (?), 16-Фев-24, 16:38   +1 +/
Последние версии винды, кстати, точно уже не на одно расширение смотрят, а способны учитывать заголовки внутри содержимого
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #113 Ответы: #132, #134

128. Сообщение от Qq (?), 16-Фев-24, 16:41   +2 +/
Времена изменились, больше расширению доверять нельзя. Вернее можно, но нельзя чтобы доверие было абсолютным
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #19 Ответы: #162

129. Сообщение от Аноним (129), 16-Фев-24, 17:17   +2 +/
А чтобы сделать перевод на иностранный язык - просто заменить буквы. А разве нет?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #108

131. Сообщение от Вы забыли заполнить поле Name (?), 16-Фев-24, 17:18   –2 +/
Радует, что новый питонячий код с аннотациями типов пишут.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #144, #172

132. Сообщение от Sergey (??), 16-Фев-24, 17:19   +/
Я понимаю что сегодняшнии мощностей компьютеров девать некуда.
Покажи хоть один дистр где не deb, rpm, .h, .c и еще много чего.
Зачем было делать обложки у книг, проще заглянуть внутрь
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #127

133. Сообщение от pfg21email (ok), 16-Фев-24, 17:26   +/
> *.tar.7z

не смеши мои тапочки :) использования в качестве сериалиазотора файлов утилиты по управлению ленточным накопителем это жуткий костыль. архив без индекса во множестве применений неудобен. если уж думать в сторону универсального функционального архива, то сейчас есть squashfs который по возможностям превышает большинство имеющихся.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #126 Ответы: #159

134. Сообщение от Аноним (134), 16-Фев-24, 17:27   +/
Заголовок ещё в DOS учитывался. От переименования COM в EXE и наоборот система в ступор не вставала.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #127

135. Сообщение от Аноним (134), 16-Фев-24, 17:28   +1 +/
Пока в 7zip не будет информации для восстановления, рару замены нет.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #94 Ответы: #183

136. Сообщение от Аноним (134), 16-Фев-24, 17:32   +/
Картинки из интернета.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #107

137. Сообщение от Аноним (134), 16-Фев-24, 17:33   +1 +/
А теперь добро пожаловать в реальную жизнь. А ещё кроме побитых ФС встречаются побитые накопители, и никакая нормальная ФС тут не поможет.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #119 Ответы: #143

138. Сообщение от Аноним (134), 16-Фев-24, 17:35   +1 +/
Рулить переменными окружения через гуй ещё начиная с XP можно.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #118

139. Сообщение от Аноним (134), 16-Фев-24, 17:36   +1 +/
Очень стандартно, а если у меня оболочка нестандартная? Zsh тоже оттуда читать будет?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #77 Ответы: #149

140. Сообщение от Аноним (140), 16-Фев-24, 17:44   –1 +/
Но это 5-6 мс нейронки. А это не то же самое что 5-6 мс алгоритма.
Тут надо смотреть на качество ответа.
С таким же успехом можно и алгоритм подкрутить в духе "отвечай за 4мс, если не успеваешь отдавай рандомный ответ из непроверенных форматов".
Ну и справедливости ради можно и нейронку подкрутить поставив на выходе вторую нейронку "убедись что ответ с высокой вероятностью правдив" и увеличив время выполнения до бесконечности.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6 Ответы: #156

141. Сообщение от Аноним (134), 16-Фев-24, 17:45   +/
Дедам годилось, и нам сгодится!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #103 Ответы: #151

142. Сообщение от Аноним (-), 16-Фев-24, 17:46   +/
Питонисты никогда не умели в posix api. Поэтому все эти supervisord, celery и os.path цветут пышным цветом и отравляют жизнь нормальным людям.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #60 Ответы: #150

143. Сообщение от Аноним (140), 16-Фев-24, 17:47   +1 +/
Добро пожаловать в клуб экстрасенсов, которые предскажут данные по 0% исходных. В остальном все просто - если данные есть (пускай и в соседних блоках или можно исправить по кодам или читается один раз из 100), то их можно восстановить (другое дело что не для каждой ФС есть удобный инструмент).
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #137 Ответы: #157

144. Сообщение от Аноним (-), 16-Фев-24, 17:48   +1 +/
Что радует, то, что в number теперь можно сунуть string или то, что в питоне процветает карго культ статической типизации?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #131 Ответы: #167, #169, #171

145. Сообщение от Аноним (140), 16-Фев-24, 17:49   +1 +/
Заходит изобретатель в бар и говорит:
Знаете, у меня есть гениальная идея, но я вам ее не расскажу...
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #36

148. Сообщение от Аноним (148), 16-Фев-24, 18:19   +/
poetry - это не поделка гугла. Это хипстерская система пакетирования, используемая поехавшими хипстерами, завязанная на venvы и не следующая стандарту PEP 621.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #117

149. Сообщение от Аноним (148), 16-Фев-24, 18:21   +/
кажется был ещё какой-то файлик, но я добавляю в bashrc. zsh не имеет смысла без oh my zsh — помойки скриптов от кого попало.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #139

150. Сообщение от Аноним (148), 16-Фев-24, 18:22   +/
это не posix api, а кроссплатформенное. просто имя совпадает.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #142

151. Сообщение от Аноним (148), 16-Фев-24, 18:23   +/
нет, не сгодится, к сожалению.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #141

152. Сообщение от Аноним (148), 16-Фев-24, 18:25   +/
если выкинуть ненужные свистоперделки, то и на более ранних пойдёт.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #112 Ответы: #154

153. Сообщение от Аноним (153), 16-Фев-24, 18:52   +1 +/
> Это как раз та область где просто нужна база магических слов (примерно как и MIME) и никакого машинного обучения не нужно.

В тексте же прямо написано, что магические слова на 50% чаще ошибаются, и что именно машинное обучение нужно: «Задействование методов глубокого машинного обучения позволило на 50% повысить точность определения по сравнению с ранее применявшейся в Google системой на основе вручную заданных правилах».

Но проблемы нет, сделай свою систему на магических словах и утри нос уже этим гоголям. Нарасхват будешь!

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1

154. Сообщение от Аноним (6), 16-Фев-24, 19:01   +/
Более ранние, чем 3.8? Ты сейчас серьёзно? Это абсолютный минимум во всех проектах, причём, объективно, должно быть хотя бы 3.9. В коде просто тонны легаси из-за этой поддержки доисторических версий.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #152

155. Сообщение от Другой анон (?), 16-Фев-24, 19:24   +2 +/
Внезапно, но изменение расширения может сделать зловред или хакер. И что тогда будете делать?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #111 Ответы: #170, #173

156. Сообщение от амоним (?), 16-Фев-24, 19:30   +1 +/
ананим фантазирует?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #140

157. Сообщение от Аноним (134), 16-Фев-24, 19:32   –1 +/
Вот для создания удобного инструмента такая библиотека очень и пригодится.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #143

158. Сообщение от Аноним (134), 16-Фев-24, 19:50   +/
Не выпендривались бы и сделали на мейкфайлах, чтобы анониму было удобно.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #32

159. Сообщение от _ (??), 16-Фев-24, 20:12   +/
Дык ... эта(С) ...  

tar есть на всём что хоть как то проходило рядом с *unix* !

... оно впрочем и под полуоЗЗЪ есть и под форточки, и под голубятню вашу и под ХЗ что ещё!
    ( Не ну а фиг ли ты хотел от софта на "дыряшечке" написанного пенЗионЭрами ;-Р )
... и до сих пор чуть ли не единственный кто аккуратно работает со всей этой помойкой :)
... включая ленты, да!!!!
    ( И они щуко(!) оказывается - ещё есть! Вот в понедельник осчастливили что мы раним тыщЩщу лент и "не желаете ли пошредить к еням"? :) А как? Не прочитав то? Там фин. инфа. У одменов инсульт :) )


Твой же squashfs есть у тебя и ... и ... оппа :)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #133 Ответы: #193

161. Сообщение от Kuromi (ok), 16-Фев-24, 20:26   +/
Trid это вот и делает. Причем много-много лет как, так что такое вот достижение.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1

162. Сообщение от Аноним (134), 16-Фев-24, 20:31   +1 +/
А ещё некоторые забывают, что под одним расширением могут скрываться совершенно разные файлы. Вот IMG — это что? Или RAW? Или DAT?
А ещё (игроделы любят) давать свои расширения стандартным файлам.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #128

163. Сообщение от чатжпт (?), 16-Фев-24, 20:56   +/
> Это тут причем ? Не давай расширения от балды и все будет нормально.

ты с Дос на Вин3.11 уже обновился или еще нет?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #111

165. Сообщение от Аноним (165), 16-Фев-24, 22:25   +/
Бухгалтеры год за годом так и делают =)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #108

166. Сообщение от fuggy (ok), 16-Фев-24, 23:06   +/
Нужно сравнение всех инструментов. Сколько сигнатур умеет file? Тут заявлено 161, а на остальных оно отвечает не знаю, тогда о каких 99% точности можно говорить.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6 Ответы: #168

167. Сообщение от Аноним (167), 16-Фев-24, 23:07   +/
> в number теперь можно сунуть string

Так написал, будто это что-то плохое

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #144

168. Сообщение от Аноним (6), 16-Фев-24, 23:21   +/
Сложно сказать, но вроде не так и много. Многие файлы не распознаёт, опять же (даже на обычном utf-16 обламывается) или распознаёт с ошибками. Зато куча доисторических форматов прямиком из 70х, которые никак не встретишь сегодня, неплохо бы дропнуть их и сравнить производительность.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #166

169. Сообщение от Вы забыли заполнить поле Name (?), 16-Фев-24, 23:32   +/
> Что радует, то, что в number теперь можно сунуть string или то,
> что в питоне процветает карго культ статической типизации?

Что популярность указания типов в питоне станоавится таким же как в typescript.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #144

170. Сообщение от Аноним (170), 17-Фев-24, 00:40   –1 +/
Заранее голову включать.

Но топик новости хороший как упражнение с AI и пример использования с точными размерами базы и т.д. Просто это можно применять для другого: мелкие утилиты для конкретных целей, вместо кросс-континентальных ДЦ.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #155

171. Сообщение от Аноним (170), 17-Фев-24, 00:44   +/
> Что радует, то, что в number теперь можно сунуть string или то, что в питоне процветает карго культ статической типизации?

Учитывая, что даже AI иногда чушь порет, типизация - добро всё ещё. Ибо блокирует характерные ошибки, а AI тоже кодер не очень пока ещё.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #144

172. Сообщение от Аноним (-), 17-Фев-24, 07:43   +/
Питон испольняется на виртуальной машине. Вопрос, зачем интерпретируемому языку программирования понадобились типы?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #131 Ответы: #175, #187, #195

173. Сообщение от Sergey (??), 17-Фев-24, 09:46   +/
И что ? Это в какой нибудь винде и в линухе с каким нибудь ДЕ это может и повлиять, в любом случае это проблема той проги что это запустит.
Отгпдай что означает x в маске файла rwx.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #155

174. Сообщение от n00by (ok), 17-Фев-24, 10:17   +/
>>> У виндузятников нет механизмов ОС.
>> добавьте их в раздел реестра
>> HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\Session Manager\Environment
> Виндовс очень дружественная к пользователям система

Значит надо было набросить "монструозный механизм ОС", а не исходную ересь.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #118

175. Сообщение от Аноним (175), 17-Фев-24, 10:59   +1 +/
Типы облегчают тестирование и сопровождение кода. То есть, они нужны человеку, а не языку программирования.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #172

176. Сообщение от fidoman (ok), 17-Фев-24, 13:57   +/
удивительно зачем нейронка там, где нужен только датчик ускорения и таймер... и включаться так же можно.
видимо просто для того, чтобы громко написать буквы ИИ на упаковке и бодро трындеть об этом в рекламе.
та же проблема с телефонами, из которых убрали датчик уха и поставили "ИИ"... и которые теперь либо не выключают экран, либо включают в самый неподходящий момент.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #114

181. Сообщение от Аноним (181), 17-Фев-24, 18:04   +/
Ну вообще то ещё светофоры бывают и иногда легковушки. Грузовиков вот тоже не видел ни разу.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #116

182. Сообщение от Аноним (192), 17-Фев-24, 19:40   +/
> в исходниках 7zip же нет ничего кроме винды :)    

"/* p7zip stores posix attributes in high 16 bits and adds 0x8000 as marker..." - 7zMain.c

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #120

183. Сообщение от Аноним (192), 17-Фев-24, 19:43   +/
MultiPar правильно воспринимает par2, прицепленные к архивам (и цеплять умеет).
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #135 Ответы: #189

184. Сообщение от похъ (?), 17-Фев-24, 20:20   +/
ну так вот вам и ответ, как они это там нашли.

Причем поскольку жаловаться некуда - этот успех тоже записали в 99% точность определения - ведь file не находил ничего незаконного в единичке - а это-то чудо - вот, нашло!

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #52

185. Сообщение от Аноним (192), 17-Фев-24, 20:34   +/
> Сегодня уже как-то неактуально.

Звучит как "назло виндоводам отморожу уши". Ты хочешь прикрутить ИИ для того, чтобы он тебе подсказывал "это tar, сжатый xz". А может проще дописать ".tar.xz"? А с текстовыми форматами-то какое веселье будет - C или C++, заголовочный файл или нет, субтитры или логи, JSON или JSON5...

Расширения файлов продолжают использоваться, потому что полезны людям.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #21 Ответы: #186

186. Сообщение от Аноним (6), 17-Фев-24, 21:13   +/
Я очень сомневаюсь, что любой ИИ в принципе справится с этой задачей без извлечения файла неизвестного размера. А так, каждый день я вижу зип-файлы переименованные в рар, рар переименованные в 7з и так далее. Видно, как они полезны людям.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #185 Ответы: #188

187. Сообщение от Вы забыли заполнить поле Name (?), 17-Фев-24, 21:51   +/
> Питон испольняется на виртуальной машине. Вопрос, зачем интерпретируемому языку программирования
> понадобились типы?

1. Эта информация исользуется и доступна в рантайме: dataclasses, pydantic
2. Типы можно проверить до запуска (как в typescript), а в рантайме игнорить. Это разные вещи.
3. В python добавили экспериментальный jit https://github.com/python/cpython/commit/f6d9e5926b6138994ea...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #172

188. Сообщение от Аноним (192), 17-Фев-24, 22:00   +/
Ну да, полезны. Они хотя бы их не удаляют со словами "сегодня уже как-то неактуально" и ошибаются лишь в пределах ассоциаций с одной программой.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #186

189. Сообщение от Аноним (134), 17-Фев-24, 22:27   +/
Ничуть не сомневался, что какой-нибудь костылинг предложат.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #183 Ответы: #190

190. Сообщение от Аноним (192), 17-Фев-24, 22:51   +/
Всегда пожалста.

У par2 есть свои плюсы - открытый формат, множество реализаций, отсутствие привязки к типу архива.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #189 Ответы: #194

191. Сообщение от Аноним (191), 18-Фев-24, 16:49   +/
7z - это и архиватор, и компрессор. использовать в добавку tar не надо. Или это была шютка юмора?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #126 Ответы: #192

192. Сообщение от Аноним (192), 18-Фев-24, 19:33   +1 +/
Если хотеть архиватор, сохраняющий больше метаданных, чем 7-zip, то не шутка. Если сторониться победы unix way над здравым смыслом, то есть ещё dar (попытка заменить tar) и wim (кроссплатформенный из-за wimlib).
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #191

193. Сообщение от pfg21email (ok), 19-Фев-24, 18:44   +/
>  tar есть на всём что хоть как то проходило рядом с *unix* !

ага, это единственный его плюс, всё остальное - минусы :)

> Твой же squashfs есть у тебя и ... и ... оппа :)

поддержка есть в куче систем, формат потихоньку пробивает себе дорогу.  
как и тар когда-то воевал с другими сериализаторами.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #159

194. Сообщение от pfg21email (ok), 19-Фев-24, 18:46   +/
> У par2 есть свои плюсы - открытый формат, множество реализаций, отсутствие привязки
> к типу архива.

и практически нулевая распространенность :) да и с развитием par херово, для использования в винде к примеру пришлось долго его искать.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #190

195. Сообщение от Аноним (195), 21-Фев-24, 20:00   +/
Языку программирования ничего не нужно, "он же памятник!" (с)
Объяснять зачем нужны типы бессмысленно - программисту это и так понятно, остальные поймут на первом курсе. Или не поймут.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #172


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру