The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Революционная система слежения за объектами OpenTLD выпущена под лицензией GPL

08.04.2011 12:33

Zdenek Kalal, исследователь искусственного интеллекта и компьютерного зрения, представил исходный код проекта OpenTLD, распространяющийся под лицензией GPL 3. Проект написан на языках C и Matlab и пока поддерживает только ОС Windows. Тем не менее, в ближайшем будущем Matlab-участки кода планируется переписать на чистом Cи и сделать проект совместимым с Linux и Mac OS X, а также портировать его на платформы Android и Apple iOS.

Суть проекта заключается в том, что компьютерное приложение может следить, распознавать, запоминать и учиться узнавать практически любые объекты, которые пользователь захочет отслеживать. Predator, кодовое имя проекта, позволяет вам указать любой объект на видео кадре, а затем система будет продолжать следить и узнавать его даже если объект меняет форму, ориентацию в пространстве, если меняются условия освещения. Система невосприимчива к цветовым параметрам объекта, так на видео было показано, как она обнаружила чёрнобелое лицо исследователя среди множества похожих фотографий на листе альбома.

Проект без сомнения ожидает светлое будущее, в связи с обширной областью применения, в которой он может использоваться - будь это взаимодействие компьютера и человека (human computer interactions), дополненная реальность, пост-обработка видео, захват движения, видео наблюдение, навигация роботов и помощь в управлении автотранспортом. Для обсуждения и работы над OpenTLD создана дискуссионная группа.

  1. Главная ссылка к новости (http://techland.time.com/2011/...)
Автор новости: Artem S. Tashkinov
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/30177-computer
Ключевые слова: computer, vision, artificial, intelligence
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (53) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Anon (ok), 13:33, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    В чём отличие от OpenCV?
     
     
  • 2.2, EuPhobos (ok), 13:40, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +7 +/
    > В чём отличие от OpenCV?

    Ага, тот же вопрос сразу возник..
    Наверное тем, что это только на винде, и вдруг стало никому не нужным - попытка выживания?

     
  • 2.28, nonym (?), 15:18, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Эта библиотека использует OpenCV для своей работы. Другой вопрос почему автор не просто сделал патч для opencv а предпочел свой огород городить?
     
     
  • 3.32, Anon (ok), 15:35, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Тогда всё ясно, спасибо за пояснение.
    А в чем суть то "библиотеки" или бы патча этого? Он адаптировал OpenCV для каких-то определённых областей применения?
    И как интересно ему удалось поломать совместимость с другими платформами своей библиотекой.
     
     
  • 4.60, nonym (?), 10:48, 09/04/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Эта библиотека (OpenTLD) реализует изобретенный автором алгоритм трэкинга объектов, причем реализует его на матлабе. Библиотека OpenCV - это есть набор структур данных и алгоритмов для работы с компьютерным зрением, в частности там есть и алгоритмы для трэкинга объектов. Поэтму если автор изобрел действительно хороший алгорим трэкинга, то имеет смысл включить его в состав OpenCV, а не плодитть кучу библиотек, по одной на алгоритм.
     
     
  • 5.66, anonymous vulgaris (?), 05:23, 10/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > Эта библиотека (OpenTLD) реализует изобретенный автором алгоритм трэкинга объектов, причем  реализует его на матлабе. Библиотека OpenCV - это есть набор структур   данных и алгоритмов для работы с компьютерным зрением, в частности там  есть и алгоритмы для трэкинга объектов.

    до этого места все просто замечательно

    >Поэтму если автор изобрел действительно хороший алгорим трэкинга, то имеет смысл включить его в состав OpenCV, а не плодитть кучу библиотек, по одной на алгоритм.

    ну так кто будет матлаб на си портировать то? жители страны советов? это ж так просто с языка сверхвысокого уровня быстренько на макроассемблер-переросток переписать и отладить. да еще бесплатно видимо?

     
     
  • 6.67, noname (??), 22:11, 10/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    >ну так кто будет матлаб на си портировать то? жители страны советов? это ж так просто с >языка сверхвысокого уровня быстренько на макроассемблер-переросток переписать и отладить. >да еще бесплатно видимо?

    Вы как-бы новость почитайте, там все написано. Привожу цитату:

    "Тем не менее, в ближайшем будущем Matlab-участки кода планируется переписать на чистом Cи"

     
     
  • 7.68, Anon (ok), 22:39, 10/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    >Вы как-бы новость почитайте, там все написано. Привожу цитату:

    Вы как-бы исходный код почитайте, там матлаб-кода 95%.

     
  • 7.70, anonymous vulgaris (?), 05:20, 11/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    >Вы как-бы новость почитайте, там все написано. Привожу цитату:"Тем не менее, в ближайшем будущем Matlab-участки кода планируется переписать на чистом Cи"

    Вы когда нибудь на матлабе писали? А на си?

     
  • 7.71, anonymous vulgaris (?), 05:46, 11/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    >Matlab-участки кода планируется переписать на чистом Cи

    кстати для интересующихся - пример того как матлаб функция на 4 строки переписывается на си.

    http://www.eetimes.com/design/signal-processing-dsp/4017563/MATLAB-to-C-trans

     
  • 2.35, adolfus (?), 15:51, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Тем, что "Requires: OpenCV 2.2 (make sure to compile opencv first if you run on 64bit platform)"
    Tested using MS Visual Studio 2010 compiler and OpenCV2.2

     

  • 1.3, анон (?), 13:47, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    >распространяющийся под лицензией GPL 3
    >портировать его на платформы ... Apple iOS

    Ага, а Джопс подаст на них в суд - за запуск мерзкого опенсорса на его чистой, опрятной, исключительно проприетарной иоси.

     
  • 1.4, white_raven (?), 13:48, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Для тех кто в бронепоезде скажу.
    opencv не могет отследить когда рожа "меняет форму, ориентацию в пространстве, если меняются условия освещения".
    Понятно?
     
     
  • 2.18, Anon (ok), 14:37, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Что есть "меняет форму"? Поворот/масштабирование она отслеживает великолепно. Смену освещение - тоже вполне хорошо. Ничего нового и впечатлительного на его демонстрационном ролике я не увидел.
     
     
  • 3.22, Anon (ok), 14:48, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Собсна ничего нового не увидел не только я:

    Sorry...
    This is nothing new. Maybe new to you, but 20 yrs old tech to me. This is an example of a class of (visual) pattern recognition algorithms. These algos were first used in analyzing moon photos by NASA over 20 yrs ago. My company and others (again - 20 yrs ago) used similar algos as position feedback for robotic systems. Such algos can have many properties: scale invariance (how well does the recognition perform if the object is moved away from the camera), rotation invariance, lighting invariance, etc. If you look closely (I did) this algo does not seem to be rotationally invariant as it loses lock when the hand is rotated.
    Worth a PhD? Hmmm...

     
     
  • 4.37, Crazy Alex (??), 16:20, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Где-то в открытом виде доступно лучшее? Где? Если нет - то теорией делу не поможешь. Лично я не возьмусь кодировать более продвинутый алгоритм, даже если всятеория доступна. А здесь - какое-никакое, но готовое решение. С маткада на c транслировать - это уже реально.
     
     
  • 5.44, тру йода (?), 17:25, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Почему бы тогда так и не написать - открыт улучшенный фреймворк на базе опенсиви? Так нет же, это революционный проект который без сомнения ждет светлое будущее чуть ли не во всех областях ИТ. На что народ резонно замечает - будьте поскромней, товарищ.
     
     
  • 6.46, Crazy Alex (??), 18:25, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Потому что opencv там - не самая ценная и интересная часть ни разу.

    Он и есть революционный - учитывая, что это единственная открытая система такого рода. Лично мне от существования закрытых вариантов ни жарко, ни холодно - а на этом наверняка массу всего наворотят.

    Вон, у IBM уже хрен знает сколько существует система распознавания английской речи с совершенно диким качеством - что-то вроде 99,9 - на этом колл-центры делают в штатах и Англии. Но для простых разработчиков эта штука, считай, не существует - так как стоит как самолёт. И таких примеров можно привести массу - наличие технологии "где-то там" за дурные деньги (или вообще не продающейся) ничего не решает. Мир меняет то, что доступно массам.

     
     
  • 7.49, Anon (ok), 18:54, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    >Потому что opencv там - не самая ценная и интересная часть ни разу.

    Да ну. Обоснуйтесь. По мне так тру-йода прав и весь этот пеар в СМИ звучит по-болгеносовски.

    OpenCV уже давно доступна массам. Я ещё года два назад за пару вечеров написал плагин для пиджина что определял моё присутствие в IM по анализу картинки с вебкамеры. Так что не надо ля-ля что OpenCV недоступна простым разработчикам, а этот перец нам что-то открыл. Этот перец развёл своих британских научруков чтобы получить PhD, а теперь пытается развести спонсоров.

     
     
  • 8.50, Crazy Alex (??), 19:31, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Покажите, где я писал, что OpenCV недоступна массам Недоступно было вот это п... текст свёрнут, показать
     
     
  • 9.54, Anon (ok), 20:01, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    И что это во всей системе самая ценная и интересная часть Вырезать кусок карт... текст свёрнут, показать
     
     
  • 10.62, Crazy Alex (??), 15:40, 09/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Последовательно выделяя куски и соотнося их с одной сущностью, и получаете объек... текст свёрнут, показать
     
  • 7.69, др. Франкенштейн (?), 00:55, 11/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > у IBM уже хрен знает сколько существует система распознавания английской речи с
    > совершенно диким качеством - что-то вроде 99,9 - на этом колл-центры делают в штатах и
    > Англии. Но для простых разработчиков эта штука, считай, не существует - так как стоит как
    > самолёт.

    А можно поподробнее? Она точно существует?? или любое вообще распознование речи с качеством лучше чем "очень хреновое"??
    Все такие рекламные заявления, пока что, на мой взгляд, оказывались очень существенно несостоятельными.
    Dragon Dictate, ради "переноса" которого из Бельгии в США провели целую спецоперацию, и тот тоже точность не лучше 20%, мягко говоря.

     

  • 1.5, white_raven (?), 13:51, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А ещё опенцв нужно много семплов объекта и много времени, проца и памяти что бы обучить нейронную сеть на узнавание объекта.
     
     
  • 2.19, Anon (ok), 14:39, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > А ещё опенцв нужно много семплов объекта и много времени, проца и
    > памяти что бы обучить нейронную сеть на узнавание объекта.

    Это много как раз и позволяет распознавать объект на разном фоне, с разным освещением и т.д. А тут я сильно сомневаюсь что просто выделил как он показывает и добился тех же результатов.

     
     
  • 3.21, Anon (ok), 14:43, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Кстати, если присмотреться внимательно - на всех слежках что он показывает фон и освещение почти не меняются.
     
  • 2.56, tavaaver (?), 22:36, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • –1 +/
    "Чтобы" пишется слитно.
     

  • 1.6, Аноним (-), 13:54, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А правда что автор якобы не хотел его открывать, но (нечаянно?) выложил в паблик, после чего код утёк?
     
  • 1.7, анонимус (??), 13:58, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Еще один шаг на пути к созданию Skynet.
     
  • 1.9, Аноним (-), 14:03, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    заявленные возможности слишком хороши чтобы быть правдой
     
     
  • 2.10, Злыдень (??), 14:08, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Поглядите видео ролик и не булькайте.
     
     
  • 3.13, Аноним (-), 14:17, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    поменьше верьте видеороликам, тогда и булькать перестанете.
     
  • 2.16, Аноним (-), 14:32, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Но если это правда, то чувак реально крут, а его разработка это просто фантастически полезная вещь и то, что он её зарелизил под GPL, даёт ему тысячи плюсов в реальную карму.
     
     
  • 3.26, Аноним (-), 15:16, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Ключевое слово "если".

    Если это правда, то это означает что один человек сделал то, что не смогла сделать целая индустрия за 50 лет. Поскольку речь идет не о науке, где такое хоть и мало, но вероятно, а об информационных технологиях, такое просто невозможно. Я имею в виду что для этого нужен качественный, а не количественный, скачок, чего в ИТ не наблюдается уже лет 25. Грубо говоря, то что невозможно было сделать в ИТ 25 лет назад, невозможно и сегодня (гигагерцами и гигабайтами этот вопрос не решается). Такое вот мое сугубо личное мнение.

     
     
  • 4.29, Аноним (-), 15:19, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Коммент выше на английском, про 20 лет и тд, не мой :)
     
  • 4.38, Crazy Alex (??), 16:24, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Да есть оно давно. Основная инновация - что это стало доступным мне и вам, так как код открыт. И это дорогого стоит.
     
  • 4.61, Michael (??), 11:58, 09/04/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Неправда ваша. Вот сейчас я практически использую DataMatrix для привязки бумаг, напечатанных пользователями (у себя дома и плохо) к логинам. Я трачу треть секунды на хороший скан, пять на плохой и десять на непригодный для автоматической обработки. Количественные улучшения означают, что десять лет назад у меня на многие картинки уходила бы полминуты машинного времени, что делало бы это бессмысленным.

    Здесь в ролике всё сказано - он замечает, когда объект медленно меняет форму (поворот головы человека от камеры) и добавляет новые шаблоны - то, во что объект превратился. Это изменение, сделанное возможным ровно тем, что ему было у кого тырить базовые алгоритмы (OpenCV) и тем, что он может тупо хранить новые картинки - что и сделало задачу доступной одному человеку. PhD - то есть три человекогода человека, которому задача интересна - это довольно много времени и работы.

    Он там честно говорит, что для смартфонов - теперь, когда он уже отладил всё это на ноутбуке до приличного уровня и проверил кучу мелочей - надо будет доделать алгоритм для оптимизации хранимого объёма. Пять лет назад компьютеры на столах быле слабее, чем те смартфоны, для которых это будет сделано. То есть задачу все эти 50 лет было невыгодно решать в общем виде и её решали с учётом особенностей применений и с затратами в десятки человеколет, а не в единицы. Вот сейчас количественное изменение доросло до состояния, когда можно решать в общем виде и публиковать.

     
     
  • 5.73, SkyRanger (ok), 02:22, 12/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > Неправда ваша. Вот сейчас я практически использую DataMatrix для привязки бумаг, напечатанных

    В любом случае это шаг вперед, так как по сути никто не сделал до него свободной библиотеки, которая могла бы делать подобное.

    По факту это почти готовое решение и от него можно уже плясать :)

     

  • 1.11, 3plet (?), 14:13, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    http://blogs.computerra.ru/10293
     
  • 1.12, Аноним (-), 14:16, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    GLP v3 и Windows-only? Мне интересна мотивация человека, сделавшего так, а так же причины, почему же он так сделал.
     
     
  • 2.15, анон (?), 14:32, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • –3 +/
    > почему же он так сделал

    Потому что умеет.

    > Windows-only

    Потому что ему работать, а не мир конпелять.

    > GLP v3

    Потому что баран, не осиливший bsd или public domain.

     
     
  • 3.40, Crazy Alex (??), 16:29, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ага, "написал код - подари корпорациям", что ли? Обойдутся. Они и платные варианты купить могут, если своей платформой делиться не хотят.
     
  • 3.58, User294 (ok), 02:16, 09/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > Потому что ему работать, а не мир конпелять.
    >> GLP v3
    > Потому что баран, не осиливший bsd или public domain.

    Обнаружены взаимоисключающие параграфы. У бздунов в этом месте должно случиться деление на ноль :)

     
     
  • 4.59, анон (?), 05:10, 09/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > Обнаружены взаимоисключающие параграфы

    just as planned :)

     
  • 2.39, Crazy Alex (??), 16:27, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Ну, тут как раз понятно. Человеку комфортно разрабатывать на винде, а сделанное - что-то вроде прототипа, с использованием известного автору и еще куче людей маткада. Что ни разу не исключает желания сделать результаты доступными для энтузиастов, а не проприетарщиков.

    Логично, в общем-то - оно написано, его УЖЕ могут гонять/тестировать желающие (и при нахрждении проблем маткадовские куски наверняка проще править, чем сишные) - а потом можно и транслировать вылизанную версию.

     
     
  • 3.64, anobymous vulgaris (?), 04:43, 10/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > Человеку комфортно разрабатывать на винде, а сделанное что-то вроде прототипа, с использованием известного автору и еще куче людей маткада.

    маткад тут не при чем, да и винда в общем не очень то. речь идет о матлабе, который фактически стандарт в науке. а матлаб, как и его свободные варианты(scilab, octave, freemat и т.п.) как раз кроссплатформенный, так что на винде клином не сошлось. но что комфортнее это да.

     

  • 1.27, Аноним (-), 15:18, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Думаю, отличие от уже существующих систем что оно в процессе съёмки набирает кадры (в новых ракурсах), и в дальнейшем сможет определять цель в этих ракурсах тоже.

    Отлично, что появилась [ещё одна] полезная открытая библиотека. Сфер применения - не счесть (та же стабилизация видео, распознавание лиц, виртуальная мышь, слежение за объектом) - при этом оно будет работать на уже существующем оборудовании!

     
  • 1.36, Аноним (-), 16:09, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Так автор TLD не хотел же открывать проект и даже попросил удалить исходники с гитхаба. Или он все же решил открыть?
     
  • 1.42, arabe (?), 16:35, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    так я и не понял, написал он свою библиотеку; пользуется OpenCV (пропаченной лично? или не измененной?); в чем профит, если с OpenVC можно смастерить такую жe поделку??? или низя?
     
     
  • 2.43, Anon (ok), 17:11, 08/04/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Профит очевидно в получении PhD.
     
  • 2.65, anonymous vulgaris (?), 05:13, 10/04/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    что ту непонятного - написал новый алгоритм, с импользованием библиотеки так во... большой текст свёрнут, показать
     

  • 1.53, User294 (ok), 19:46, 08/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +5 +/
    А вот и достаточно существенные запчасти к терминатору подвезли :)
     
  • 1.57, Рулиус (?), 02:06, 09/04/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Буквально позавчера читал его коментарии что попридержит коней в опубликовании кода, и вот сегодня такое !
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру