URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 131898
[ Назад ]

Исходное сообщение
"Открыт код Jina Embedding, модели для векторного представления смысла текста"
Отправлено opennews , 26-Окт-23 12:26

Компания Jina открыла под лицензией Apache 2.0 модель машинного обучения для векторного представления текста - jina-embeddings-v2. Модель позволяет преобразовать произвольный текст, включающий до 8192 знаков, в небольшую последовательность вещественных чисел, образующих вектор, сопоставленный с исходным текстом и воспроизводящий его семантику (смысл). Jina Embedding стала первой открытой моделью машинного обучения, обладающей характеристиками, не уступающими пропретарной модели векторизации текста от проекта OpenAI (text-embedding-ada-002), также способной обрабатывать тексты, насчитывающие до 8192 токенов...
Подробнее: https://www.opennet.me/opennews/art.shtml?num=59996

Содержание

Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 12:26 , 26-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 12:48 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 12:50 , 26-Окт-23
  - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 12:55 , 26-Окт-23
    - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 13:02 , 26-Окт-23
      - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 19:59 , 26-Окт-23
        
        Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 20:05 , 26-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 12:50 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноньимъ, 13:07 , 26-Окт-23
  - Открыт код Jina Embedding, модели для векторного представлен...,12yoexpert, 13:29 , 26-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 12:51 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 13:20 , 26-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,12yoexpert, 12:56 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноньимъ, 13:11 , 26-Окт-23
  - Открыт код Jina Embedding, модели для векторного представлен...,12yoexpert, 13:20 , 26-Окт-23
    - Открыт код Jina Embedding, модели для векторного представлен...,_hide_, 14:00 , 26-Окт-23
      - Открыт код Jina Embedding, модели для векторного представлен...,12yoexpert, 14:16 , 26-Окт-23
      - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 05:27 , 27-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 13:24 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 13:35 , 26-Окт-23
  - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 13:49 , 26-Окт-23
    - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 16:01 , 26-Окт-23
  - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 16:00 , 26-Окт-23
  - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 16:35 , 26-Окт-23
    - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 17:26 , 26-Окт-23
    - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 11:43 , 27-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,YetAnotherOnanym, 16:15 , 26-Окт-23
  - Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 04:29 , 01-Ноя-23
    - Открыт код Jina Embedding, модели для векторного представлен...,YetAnotherOnanym, 11:07 , 01-Ноя-23
Открыт код Jina Embedding, модели для векторного представлен...,sena, 14:21 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 15:57 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Cradle, 21:10 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Твой сосед с вайфаем, 23:22 , 27-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,bjaka.max, 10:37 , 24-Ноя-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 14:23 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 15:48 , 26-Окт-23
  - Открыт код Jina Embedding, модели для векторного представлен...,48, 17:22 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 19:40 , 26-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 16:13 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 18:18 , 26-Окт-23
  - Открыт код Jina Embedding, модели для векторного представлен...,коньюктив ит, 18:49 , 26-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 19:37 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 20:02 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,Neon, 14:46 , 30-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 22:25 , 26-Окт-23
- Открыт код Jina Embedding, модели для векторного представлен...,michael516, 15:13 , 27-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,test, 08:00 , 27-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 12:22 , 27-Окт-23
Открыт код Jina Embedding, модели для векторного представлен...,Аноним, 16:26 , 01-Ноя-23

Сообщения в этом обсуждении

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 12:26

Я только не понимаю, почему так популярно повторять эту чушь в духе "не уступающими пропретарной модели", ведь, совершенно очевидно, это сразу позволяет сделать все нужные выводы об авторах и их поделке.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 12:48

Круто, а можно скормить текст этой новости? Что на выходе?

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 12:50

на выходе будет 4739427419879182482756384539874569234

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 12:55

Не верю. Модель выводит не одно десятичное число, а вектор float32.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 13:02

да, это вектор, просто я весь вектор привел в int128.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 19:59

128 / 32 = 4. Ты хочешь сказать, что 4мя флоатами любой текст описывается?

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 20:05

А доку открыть никак? Там 512-ти мерный вектор. Еще можно 1024-мерный. В зависимости от модели и заданных параметров.. Но речь про 512 флоатов по 4 байта.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 12:50

Йа, йа! Ничуть не хуже!* Аналогов нет!** Бесплатно!***

* Одной протестированной (по непонятным критериям) соперницы из десятков
** Среди таких же бесплатных.
*** До первого серьёзного коммерческого предложения

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноньимъ , 26-Окт-23 13:07

Ты чего рвёшься то на ровном месте?

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено 12yoexpert , 26-Окт-23 13:29

это плато

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 12:51

>под лицензией Apache 2.0
В репозиториях нет файла лицензии.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 13:20

Достаточно упоминания.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено 12yoexpert , 26-Окт-23 12:56

> (базовая - 0.27 ГБ и сокращённая - 0.07 ГБ)
а в петабайтах будет казаться ещё меньше! вам бы маркетологов на завод отправить

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноньимъ , 26-Окт-23 13:11

Базовая 270000 KB и сокращённая 70000 КБ.
Можно на микроконтроллерах крутить.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено 12yoexpert , 26-Окт-23 13:20

я для базовой 2319282339.84 бит насчитал, можно даже в столбик обработать, микроконтроллеры избыточны

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено _hide_ , 26-Окт-23 14:00

Этот человек еще со школы не понимал шутку про 1,5 землекопа )))

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено 12yoexpert , 26-Окт-23 14:16

так ты бы объяснил, а то мы все тупые

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 27-Окт-23 05:27

Шутку про землекопа может понять тот, кто вырос на советских мультиках.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 13:24

А смысл?

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 13:35

Смысл станет ясным к завершению проекта. Сейчас можно лишь предполагать, что результатом будет иск на $75 млн. https://www.cnews.ru/news/top/2023-10-23_muzykalnaya_otrasl_...

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 13:49

Почему на Гугл иск не подали, ведь у него в индексе весь интернет?

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 16:01

Ты не понял смысл написанного. Иди и прочти новость 10 раз.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 16:00

Иска не будет. они будут Свободный текст превращать в ветор.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 16:35

Это ещё ничего. Вот когда кто-то догадается натренировать нейросетку на юридических и судебных материалах стран с прецедентным правом, и стоящую в США миллионы долларов работу целой оравы адвокатов и юристов будет делать с таким же качеством какой-нибудь LawyerGPT за два доллара, вот тогда будет эпичное веселье.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 17:26

лоеры научаться эксплуатировать несовершенства модели и будут обдирать всех пользователей оных как липки.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 27-Окт-23 11:43

Не думаю. Поиск в сети уже отравлен. ИИ уже в коллапсе.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено YetAnotherOnanym , 26-Окт-23 16:15

Например, к спамобойке прикрутить. Тогда админ задаёт некий общий смысл (например, "несите ваши денежки инвестировать вместе с Тинькофф"), а сабж накидывет парочку баллов в оценку, если смысл текста близок к заданному.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 01-Ноя-23 04:29

Угадай сколько в этом тексте латинских символов?
>неcитe вaши дeнeжки Nнвeстирoвaть вмeстe с 7иньк0фф

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено YetAnotherOnanym , 01-Ноя-23 11:07

Делов-то, для каждой буквы кириллицы составить список омоглифов и перед обработкой проводить нормализацию текста.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено sena , 26-Окт-23 14:21

И наоборот можно будет? Типа задал вектор 42, и оно тебе сгенерировало текст о смысле жизни. Добавил к вектору ещё 0.13 и оно модифицировало смысл в сторону бессмыслености жизни и т.п.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 15:57

Ты выныриваешь раз в три года чтобы написать комментарий? Похвально чо.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Cradle , 26-Окт-23 21:10

"Правитель наблюдает мир и знает,
Что путь управления един.
Но единое всегда превращается в двойственность явлений,
А все явления имеют троичную структуру,
В которой соединяется идеальное, материальное и реальное.
А вот из троичности образуется множественность всех событий и предметов..."
дао-де цзин, глава 42 (из 81)

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Твой сосед с вайфаем , 27-Окт-23 23:22

Ты только что изобрел ChatGPT, только циферки вводятся неявно.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено bjaka.max , 24-Ноя-23 10:37

Тут интереснее скорее можно ли, взял другую сетку натренированную на русском языке, подсунул ей векторы полученные в английской и у тебя перевод? Не нужно тренировать отдельно сетку переводящую с монгольского на японский, а взял сетку японскую и сетку монгольскую и ага.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 14:23

Не раскрыта тема размерности векторного пространства.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 15:48

768

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено 48 , 26-Окт-23 17:22

1024

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 19:40

Речь не о тех векторах.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 16:13

Не смысла, а поля интерпретаций из текста в текст. Хотя, в современной семантике смысл трактуется именно, как отображение одного текста в другой.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 18:18

А как работает смысл не относительно чего-то? И разве относительно чего-то мои чувства и ощущения?

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено коньюктив ит , 26-Окт-23 18:49

Ваши чувства и ощущения - это иллюзия порождаемая всего лишь несколькими тысячами (десятками тысяч в редких случаях) паттернов выстраиваемых в цепочки генератором псевдослучайных чисел.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 19:37

Тексты для тренировки подбираются запатентованным образом или достаточно взять все существующие работы по схоластике, астрологии и марксизму-ленинизму?

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 20:02

Предполагаю, что для отбора текстов использовалась другая LLM с текстовым запросом.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Neon , 30-Окт-23 14:46

Да весь рекламный бред от маркетологов скормить бедному AI и посмотреть, что с ним будет.)))

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 26-Окт-23 22:25

Векторный гипертекстовый фидонет всё ближе

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено michael516 , 27-Окт-23 15:13

Шутка, понятная не только лишь всем

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено test , 27-Окт-23 08:00

А есть ссылка на пример ? Текст + Картинка.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 27-Окт-23 12:22

> позволяет преобразовать произвольный текст, включающий до 8192 знаков
Токенов, а не знаков.

"Открыт код Jina Embedding, модели для векторного представлен..."
Отправлено Аноним , 01-Ноя-23 16:26

ЛСДУЗ и ЙФЯУ9 в ней сгенерили?