зао «эвентос»
TRANSCRIPT
ЗАО «Эвентос»
Заявка на грант
Решаемая проблема
Экспоненциальный рост неструктурированной информации делает если не невозможным ее
ручной анализ, то очень дорогим.
Решаемая проблема
Ручной анализ информации публикуемой в СМИ и социальных медиа может потребовать
существенных трудозатрат и поэтому часто неэффективен!
Задачи информационного анализа
• При анализе информации необходимо:– Выполнять ее классификацию– Выделять информационные объекты– Объединять отдельные сообщения в группы в
зависимости от их контекста– Иметь возможность быстро найти все документы
определенной тематики и посмотреть ретроспективу развития события во времени
– Сделать предположение о возможном дальнейшем развитии определенной ситуации
Рынок
• Рынок мониторинга социальных медиа• PR агентства и департаменты компаний• Безопасность • Online реклама• Наука и исследования• Электронный документооборот• News & Media
Обзор рынка и прогнозы спроса
Worldwide Business Analytics Software 2014–2018 Forecast and 2013 Vendor Shares
Конкуренты
Лидеры:• В мире:
– AlchemyAPI (IBM)– OpenCalais (Reuters)– Expert System
Semantic intelligence– GATE– NetBase Solutions, Inc.– Google
• В России:– ABBYY– RCO fact extractor
Остальные• NETagger • Saplo (стартап)• OpenNLP• Stanford CoreNLP
Ключевая технология – Машинное обучение
Одна технология позволит решать все представленные ниже задачи
Новый подход к решению задач анализа
данных
Наши преимущества
• Настройка новых предметных областей без лингвистов и программистов
• Высокое качество выделения объектов и скорость обработки
• Удобные, интеллектуальные механизмы для формирования корпуса обучения нейронных сетей
• Мультиязычность• Возможности до-обучения и настройки на новые
предметные области
Бизнес-модель
• SaaS• Продажа лицензий для организаций с
конфиденциальной информацией• Сдача в аренду ПО – Amazon EC2 (Amazon
Machine Image), Microsoft Azure • Партнерская программа для создания и
распространения решений для отдельных предметных областей
Маркетинг и продажи: как будете выходить на рынок
1. Создание SaaS решения с бесплатно-ограниченным доступом
2. Предоставление доступа к системе по подписке
3. Предоставление возможности пользователям скачать и воспользоваться самостоятельно, на своем оборудовании сформированными программными модулями
4. Интеграция всех видов решения в единый программный комплекс с общим интерфейсом
– Настройка и выделение пользовательских объектов– Классификация и кластеризация (определение контекста
текстов) текстов– Хранение, анализ и публикация данных в открытых
форматах (RDF СУБД)
Что уже есть и что будет
• Уже сделано
1. Разработан прототип и первая версия комплекса сбора и определения контекста документов (классификация и кластеризация)
2. Разработана технология выделения любых объектов с использованием машинного обучения
3. Разработан прототип системы обучения новых предметных областей (98% точности при выделении объекта типа Персона)
• Ближайшие планы
1. Создание многопользовательской платформы проектирования и обучения новых предметных областей
2. Внедрение решения выделения фактов («Иванов» работает в ООО «Ромашка»)
3. Создание SaaS решения для контекстного анализа и классификации текстовых документов
Наша Команда
Команда из 30+ высококвалифицированных специалистов – руководителей проектов, лингвистов и программистов
Текущий статус (что сделано), план-график (что и когда планируется
• Имеется:– Разработана базовая технология– Имеется действующий прототип системы
• Планируется (1 очередь)– Разработка SaaS решения
• Web интерфейсы для настройки и обучения систем
• Наличие необходимых API сервисов загрузки и анализа данных
• Механизмы автоматического масштабирования нагрузки
Потребности в капиталовложениях
• Дополнительное финансирование необходимо для:– Создание портала формирования создания размеченных
корпусов для обучения лингвистических процессоров для различных доменов.
– Создание хранилища для обработки корпусов текстов для новых доменов (древнерусские тексты, научная литература и т.д.)
– Создание системы распределенной обработки больших объемов текстов для разных доменов
– Подключение системы оплаты SaaS сервиса– Разработка механизмов распознавания и учета при анализе
полисемии (многозначность смыслов слов)– Создание решения классификации и кластеризации текстов
в виде SaaS продукта
Спасибо за внимание!
ЗАО «Эвентос»пр. Вернадского, 84 корп. 2
119606, Москва, Россия
Тел: +7 (499) 956 09 45
Факс:+7 (499) 956 07 49