Вы здесь

Секция «Управление данными»

19
Апр
2017

Виталий Саяпин (DELL EMC), секция "Управление данными" СИИС-201712 и 13 апреля в Академпарке в рамках форума СИИС–2017 специалисты в области IT собрались, чтобы представить свои доклады и обсудить направление движется мирового и российского рынка IT-индустрии, тенденции и прорывные технологии. Обсуждение происходило в рамках секции «Управление данными».

12 апреля

Секцию открыл председатель совета директоров компании «Ломоносов Капитал» Евгений Гайслер своим докладом об информационных технологиях опережающего развития и будущем IT-индустрии.

Евгений рассказал, что нас ждет некий барьер преодоления разрыва между технологическими возможностями интернета, огромного числа устройств и дикой производительностью компьютеров и необходимостью всем этим управлять. Для этого нужно тратить деньги на уровне поисковых работ, чтобы эти барьеры как-то преодолеть.

Доклад породил дискуссию о том, как наша страна относится к IT-индустрии. С точки зрения закупки программных продуктов наша страна тратит в 20 раз меньше, чем США:

— Технологически мы можем быть готовы, но если мы не поймем, как будет выглядеть наше общество, и к какому состоянию общества мы будем подгонять наши технологические достижения, то все наши усилия будут напоминать создание социальной сети «Одноклассники», (когда во всем мире пользуются «Facebook»),  подытожил Евгений Гайслер.

Евгений Терешин (Москва), эксперт в сфере виртуальной и дополненной реальности, рассказал об управлении восприятием, а также о технологиях виртуальной и дополненной реальности, их перспективах на рынке.

Данные технологии могут привести к негативным последствиям. Например, человек постепенно перестает критически воспринимать окружающую действительность, потому что у него под рукой всегда есть «Окей, Гугл», который предоставит ответ на все вопросы.

— Данные технологии будут развиваться независимо от наших желаний. Но нужно искать пути развития, которые не гробят человека как личность,  пояснил докладчик.

Александр Лысковский, основатель компании «Алавар», выступил с докладом «Прорывные старт-ап истории. Инвестиции в IT».

Любая современная технология  это своего рода стартап. Александр поделился своим опытом как в сфере инвестиций, так и в сфере стартапов и представил аудитории некоторые практические советы:

— Мой опыт показывает, что самое сложное  начать говорить на одном языке ивесторам и молодым стартаперам. Люди, которые создали интересные проекты, горят своей идеей, очень хотят, чтобы кто-то дал им денег и поверил в них. Но они не готовы говорить еще о чем-то. А люди, у которых есть деньги, хотят вложить их с выгодой. Хотят, чтобы их уважали и говорили «Спасибо» за их деньги.

Доклад вызвал интерес у аудитории, многие участники выразили желание пообщаться с докладчиком вне форума.

Антон Колонин из компании «Aigents Group» в рамках своего доклада «Изучение персонального окружения в социальных сетях» рассказал о том, как социальные сети следят за нами, и как с помощью ежедневной информации, которую люди передают через социальные сети, можно предсказать поведение людей, а значит и управлять им.

Это используют специалисты в сфере продвижения товаров при формировании поведения потребителя на рынке:

— По данным нашего перемещения на местности можно вычислить наши социальные связи. Провайдерам, которые предоставляют услуги интернет-связи, доступна персональная и социальная информация, включая связи и коммуникации»,  пояснил докладчик.

Также Антон Колонин представил инструмент, с помощью которого можно анализировать след человека в социальных сетях. Он анализирует окружение, интересы пользователя и может давать рекомендации на основе этих данных.

Евгений Павловский, заведующий лабораторией аналитики и потоковых данных машинного обучения НГУ, представил аудитории свой доклад «BigDataMachine Learning. Искусственный интеллект. Обучаем машины для службы людям».

Евгений рассказал об аналитике больших данных, способах извлечения ценной и необходимой информации и применении нейронных сетей в бизнесе:

— Нейронные сети универсальны, как и алгоритмы машинного обучения. Они могут применяться, например, для прогнозирования оттока абонентов, даже при низких показателях точности. Экономически нейронная сеть может ничего не объяснять, зато она принимает решения, что и дает операционный доход.

Также Евгений Павловский поделился опытом успешной разработки методов обучения нейронных сетей и расширения базы данных. Сейчас к технологии распознавания лиц очень большой интерес. Глубокие нейронные сети сделали существенный шаг в распознавании лиц и в решении тех задач, которые традиционно решает человек. Однако нейронные сети бесполезны без базы изображений.

— Китайцы почему-то заинтересовались этой разработкой отметил докладчик.

Также Евгений поделился успехами Института Математики СО РАН им. Соболева в разработках, которые позволили сократить время опознавания человека по голосу с 20 до 5 секунд.

О современных технологиях в сфере управления знаниями рассказал Иван Гришков, представитель компании «The Invaders».

Он рассказал, куда смотрит «управление знаниями», какие сейчас существуют тенденции: в частности, о системе Blockchain и технологиях больших данных. Докладчик также затронул тему технологий дополненной реальности. Как и Евгений Терешин, Иван Гришков считает эту область наиболее перспективной и реализуемой:

— Для дополненной реальности достаточно просто смарфона. Я даже не буду спрашивать у кого из сидящих в зале есть смартфоны. Уже сейчас вы может опробовать эту технологию.

Алексей Худяков представил свой доклад «Смешанное обучение  эффективное обучение сотрудников» и рассказал о трендах в области электронного обучения:

— Смешанное обучение  это удачная комбинация традиционных классов, самостоятельного обучения и онлайн-образования.

Капитал любой компании  это сотрудники, эффективность которых помогают повысить инструменты электронного обучения. Смешанное обучение, по мнению Алексея Худякова, актуально для крупного бизнеса и университетов.

Директор центра компетенции по смарт-технологиям НГУ Руслан Пермяков выступил с докладом «Blockchain. Применение в бизнесе».

Blockchain  это система, которая позволяет децентрализовано договориться разным людям. Руслан Пермяков рассказал о механизмах этой системы, преимуществах и применении, в частности, об умных контрактах. Это договор в цифровой форме, где математически прописаны обязанности сторон, а система автоматически проверяет их выполнение.

В заключении первого дня форума Екатерина Касакина поделилась опытом своей компании в сфере дизайна мышления.

Это тренд в IT. Данная методика позволяет стартапам проверить свои гипотезы быстрее. Екатерина рассказала о творческом процессе, который происходит у них в компании во время запуска новых стартапов.

13 апреля

Во второй день в рамках секции «Управление данными» прошел научно-технический симпозиум Siberian Symposium on Data Science and Engineering, поэтому день был насыщен научными докладами. Участники обсудили, как повысить эффективность работы бизнеса за счет правильно выстроенных процессов управления данными.

Секцию открыл Игорь Попов с докладом об обнаружении вредоносного программного обеспечения с использованием машинного обучения на основе векторных представлений инструкций машинного кода.

Докладчик рассказал о преимуществах и недостатках существующих подходов к решению данной проблемы и представил свой. Эта тема актуальна на сегодняшний день, так как вредоносное ПО является постоянной угрозой для IT-индустрии.

О способах управления большими данными с помощью специализированной системы «Polar» рассказала следующая докладчица из Института систем информатики СО РАН Елена Артамонова.

Она также рассказала о разработке новых возможностей обработки больших данных и расширении сферы использования специализированных баз данных, в частности «Polar».

Данное исследование может быть полезным для аналитики больших данных. В частности, таких ее направлений, как получение данных из данных, например, аналитика поведения в социуме, работа с данными, которые имеют большой объем и трудно обрабатываются.

Алексей Какунин представил свой доклад «Автоматизация B2B процессов». Он предложил аудитории «отдохнуть от обработки данных» и поговорить о бизнес-процессах.

Тема актуальна, поскольку на сегодняшний день в России IT-системы достаточно развиты внутри компаний. Все компании имеют устоявшуюся работу программных обеспечений, которые связаны друг с другом для выполнения ежедневных задач.

С целью оптимизации затрат большинство компаний передает свои бизнес-задачи сторонним компаниям. Хороший пример  бизнес страховых компаний, который на 90% является бизнесом работы с партнерами.

Однако инструментов для коммуникаций между компаниями (например, страховой компанией и агентами по продаже) как таковых, нет. Это влечет за собой потерю данных и низкое качество обслуживания клиентов.

Алексей Какунин представил решение данной проблемы: внедрение единой системы, которая бы объединила в рамках одного процесса всех его участников. Таким решением является B2B портал.

«Коллеги, добро пожаловать в облака»  поприветствовал участников форума Денис Астафьев из компании «RTCloud». Он представил свой доклад об облачных технологиях для государства и бизнеса, рассказал о трендах и практике применения.

 Облака  зрелые технологии. Поэтому на них можно полагаться заверил докладчик.

Также представитель «RTCloud» отметил, что в последние годы в нашей стране в бизнес-сфере существует тенденция к резервированию и бэкапированию. Облачные технологии являются простым решением, которое требует минимум затрат.

Денис Астафьев представил прогноз, который демонстрирует, что к 2018 году 85% компаний будут использовать «облака».

Следующий докладчик  ассистент кафедры высокопроизводительных компьютерных технологий Института естественных наук и математики УрФУ и младший научный сотрудник ИММ УрО РАН Дмитрий Усталов. Он представил доклад на тему «Комплекс программ извлечения данных изBabelnet».

В компьютерной лингвистике, информационном поиске, искусственном интеллекте часто бывают нужны большие семантические ресурсы. Это некие базы данных, которые предоставляют сведения о разных предметных областях. Babelnet  семантическая сеть, которая построена путем машинного перевода и ряда других автоматических методов. Она содержит много полезной информации, но работать с ним трудно.

 Есть слово «гонобобель», это синоним слова «черника». Но не все словари содержат это слово. В вашем тексте, в ваших данных могут встречаться похожие низкочастотные слова. И Babelnet такие слова содержит,  пояснил Усталов.

Докладчик представил комплекс программ, которые облегчают работу с данной системой.

Михаил Черноскутов представил доклад, над которым он работал совместно с Дмитрием Усталовым, на тему «Связность графа синонимов в задаче определения лексических значений слов». Михаил рассказал о работе с графом синонимов, который был получен на основе анализа Викисловаря.

Докладчик представил новый метод, который позволяет улучшить точность определения синонимии между словами.

Представитель компании «The Invaders» Алексей Зуев в рамках своего доклада «Управление данными в бизнес-процессах» поделился опытом, который вынес из работы в компании и своей работы над диссертацией на тему «Управление данными»:

— С управлением знаниями мы сталкиваемся в обычной жизни каждый день и даже не задумываемся над этим [...] Сталкивались, даже когда учились в школе и списывали домашку у соседей по парте.

Из доклада участники узнали об организации бизнес-процессов в компаниях и о том, как методика управления знаниями может помочь эффективно выстроить эти процессы. Также докладчик поделился успешными результатами применения этих методик в своей компании.

Директор по маркетингу компании ООО «Экспасофт» Евгений Григорьев рассказал о неиспользованных возможностях технологии распознавания лиц в ритейле.

Хотя доклад касается бизнеса, он интересен для всех, так как каждый человек ходит в магазин. Евгений представил прогноз о том, как будет меняться торговая среда с приходом новых технологий, в частности, технологии распознавания лиц:

 Торговый зал  это то, куда только шагает технология машинного обучения в ритейле, потому что до сих пор они использовались в основном в логистике, в электронной торговле. Но торговый зал  это насыщенное и сложное пространство, и масса производителей пытаются его оборудовать по-новому. Они интегрируют в свое оборудование умные технологии.

Поделились своим опытом в сфере регулирования вопросов интеллектуальных прав в больших компаниях с юридической стороны и со стороны рынка Екатерина Шехтман и Татьяна Гаврилюк в докладе «Оформление интеллектуальных прав как инструмент эффективного IT бизнеса».

Докладчицы представили чек-листы по основным юридическим вопросам, которые применимы для любого IT-бизнеса.

Ирина Вершинина, студентка Уральского федерального университета, представила свой доклад на тему «Реализация эволюционно-имитационного алгоритма оптимизации логистических процессов».

Ирина рассказала о работе ее команды над интеграцией нескольких методов оптимизации логистических процессов в один и поделилась результатами.

За кафедрой ее сменила Мария Юдина из Омского Технологического университета. Она представила свой доклад «Расчет частот 3-мотивов в больших направленных сетях методом случайной выборки каркасов»:

 Сейчас существует множество различных алгоритмов частот встречаемости, часть из них  точные, часть  статистические.

Мария представила данные анализа алгоритмов, рассказала об использованных методах, а также проблемах, возникших в ходе исследования.

Предметом обсуждения на секции также была проблема разрешения анафоры и более общая проблема  разрешения кореференции. Она возникает при обработке естественного языка с помощью машинного перевода.

Студентка НГУ Анна Козлова рассказала о гибридном подходе к разрешению анафоры в русском языке, и конкретно о разрешении анафоры в личных местоимениях.

В текстах часто используются выражения, которые не могут быть правильно истолкованы без контекста. К таким выражениям относятся местоимения третьего лица. Для понимания текста необходимо понять, к какому выражению из предыдущего предложения относится это местоимение.

Анна представила алгоритм, который соотносит личные местоимения с существительным, от которого зависит интерпретация этого местоимения.

Следующий докладчик тоже представлял НГУ. Никита Николенко рассказал о FRIS  цензурировании эталонной выборки изображений в задаче нейросетевого распознавания лиц:

 Современные технологии распознавания лиц дают хорошие результаты. Но это из-за того, что фотографии, на которых происходит тестирование, очень высокого качества. В реальной жизни добиться таких условий очень сложно.

В связи с этим исследователи поставили перед собой задачу разработать метод распознавания лиц для последовательности кадров, содержащих изображения одного человека. Николенко рассказал о ходе эксперимента и поделился его результатами.

Директор по исследованиям и разработкам ​ DELL EMC в Казахстане Виталий Саяпин представил доклад на тему: «Интернет вещей. Упрощенный»:

 В чем мы видим ценность интернета вещей для бизнеса? Это повышение операционной эффективности, новые впечатления клиентов, смягчение рисков и новые модели доходов.

Интернет вещей  это экосистема, в которой датчики устройства и оборудования подключены к сети, они могут передавать и получать данные для отслеживания и каких-то действий.

Почти на каждом предприятии есть оборудование, которое не подключено к интернету, операционные технологии. Саяпин рассказал, что его компания видит свою миссию в том, чтобы раскрыть потенциал так называемых «неприсоединенных вещей». Однако существует проблема безопасности соединений и интеграции информационных и операционных технологий, поэтому большинство компаний не рассматривает эту идею как перспективную. По мнению Виталия Саяпина, эти проблемы необходимо решать и внедрять интернет вещей на предприятиях.

Юлия Смирнова представила свой доклад на тему «Исследование кибербезопасности Интернета вещей».

Следующие докладчики Александр Полыгалов и Никита Трубецкой поделили тему «Использование больших данных для решения бизнес-задач», и каждый раскрыл ее со своей стороны.

Никита Трубецкой представил компанию «Майкрософт» в Новосибирске. Он затронул тему цифровой трансформации и привел примеры подобных трансформации в известных компаниях, таких как «McDonald’s» и «Uber».

 Цифровая трансформация  проникновение технологий в разные аспекты бизнеса. Это помогает строить бизнес по-новому. Это известный тренд. В топе крупнейших компаний по капитализации находятся IT-компании. Растут эти компании благодаря тому, что находят новые рынки там, где раньше не было цифровых технологий,  пояснил Трубецкой.

Представитель компании «Экспасофт» Александр Полыгалов рассказал, как используется прикладное машинное обучение и о достижениях компании в этой области.

В продолжение темы повышения эффективности бизнеса выступил Владимир Дуда с докладом «Повышение эффективности клиентского обслуживания с помощью чатботов и технологий машинного обучения. Eyeline».

Вопрос эффективности чатботов в работе с клиентами вызвал дискуссию среди участников секции. По мнению докладчика, контакт-центры с живыми операторами требуют много затрат. Роботизация таких центров может сократить затраты в несколько раз, а также позволяет удовлетворить большую часть клиентских запросов. Содержание меню чатбота формируется в процессе машинного обучения.

Денис Ямалиев из Уральского федерального университета рассказал о классификации уровня физической подготовки по вариабельности сердечного ритма и стабиолографическим данным.

Он представил результаты исследования, связанные с идентификацией уровня физической подготовки спортсменов. Для опытов были привлечены две группы молодых людей: профессиональные спортсмены и люди, которые спортом не занимаются и не жалуются на здоровье.

Докладчик рассказал о различных методиках классификации испытуемых по биомедицинским критериям. По результатам исследования была выявлена методика, которая является наиболее эффективной для решения задач спортивной медицины.

Павел Емельянов рассказал о Декартовых декомпозициях в анализе данных.

Декартова декомпозиция  сложная методология, которая применяется при анализе и преобразованиях, а также других манипуляция со сложными системами. Павел Емельянов уверен, что такая методология полезна в области анализа данных:

 Сейчас существуют потоки данных, которые валятся на нас со всех сторон. Мы должны изучить устройства этих данных, чтобы потом их распределять по базам.

Во многом успешность информационных систем зависит от тех методов, которые используются при их разработке. Об этом рассказала Ирина Вершинина, представившая доклад своей коллеги из Екатеринбурга Ирины Спицыной на тему «Использование мультиагентных методов при разработке ИС, анализ текущего состояния».

Метод разработки должен позволять строить единую модель информационной системы, понятную всем участникам процесса, и комплексно решать проблемы автоматизации процесса согласования и принятия решений. Автор доклада ответил на все возникшие у аудитории вопросы по телефону.

Антон Белоусов из Томского государственного университета систем радиоуправления и электроники выступил с докладом на тему: «Многокритериальная оптимизация многопроводных модельных фильтров генетическими алгоритмами». Он рассказал аудитории о разработке защитных устройств и создании аналитических методов для их совершенствования, а также поделился результатами работы.

Руслан Газилов в рамках своего доклада об оптимизации длительности сверхкороткого импульса с помощью генетических алгоритмов по критерию максимизации пикового напряжения в шине печатной платы рассказал о том, как проходили тестирования алгоритмов и показал их результаты.

Василий Борисов представил свой доклад «О некоторых возможностях дискриминантного анализа для диагностики артериальной гипертензии: оценка комбинации признаков краткосрочной вариабельности сердечного ритма».

Проблема распространения сердечно-сосудистых заболеваний является крайне острой. По статистике около трети людей, страдающих гипертензией, не подозревают о своем состоянии, поэтому данная тема является актуальной. Василий Борисов представил результаты работы исследовательской группы, которые могут эффективно выявлять людей с диагнозом артериальной гипертензии и относительно здоровых людей на основе признаков краткосрочной вариабельности сердечного ритма.

«Оптимизация алгоритмов бинарной свертки для ARM процессов»  доклад Михаила Истомина.

Михаил рассказал о том, что существует проблема использования нейронных сетей в процессах классификации изображений и детектировании объектов, так как нейронные сети требуют много энергии. Решение этой проблемы автор исследования видит в использовании бинарной свертки вместо обычной. Это существенно облегчает использование нейронных сетей.

Галина Трошина представила свой доклад на тему «Моделирование итерационной процедуры оценивания динамических параметров в задаче активной идентификации».

Ирина Вершинина во второй раз выступила с докладом. Она рассказала аудитории об исследовании возможности автоматической сборки детали без стадии Computer-Aided Manufacturing. Эта стадия имеет свои преимущества, однако порой она занимает в сто раз больше времени, чем изготовление одного изделия. Ирина представила альтернативный вариант автоматической сборки:

— На данный момент есть программа, которая анализирует 3D модель, разбивает ее на составные части, сама определяет линии для сварки и проводит данный процесс. Но над этим мы еще работаем.

Эту 3D модель создает сам человек и отправляет через интернет на завод.

Артем Максутов, руководитель группы разработки инженерного центра «NRNU MEPHI», в своем докладе «Обнаружение и предотвращение атак, основанных на подмене DNS» поделился результатами разработок автоматизированной системы, которая изучает сетевое окружение с использованием как классических методов, так и с помощью интеллектуальных систем и помогает обнаружить атаки.

Елена Гриднева представила свой второй доклад о вопросах повышения эффективности блоков замен раундовых функций криптоалгоритмов.

Ирина Вершинина представила доклад еще одного коллеги — Никиты Дудина — на тему: «Сравнительный анализ мультиагентных подходов: процессы преобразования ресурсов (МППР) и сети потребностей и возможностей (ПВ-сети) при моделировании процессов логистики».

В исследовании рассматривались проблемы распределения заказов и пути их решения, которые базируются на мультиагентном подходе. Автор доклада также был на связи и с готовностью ответил на все возникшие у участников секции вопросы.

Последним докладчиком секции «Управление данными» стал Василий Дедок, старший научный сотрудник института математики им. Соболева, который в своем докладе предложил метод искусственных нейронных сетей для решения задач аномальной диффузии. Он рассказал о проблемах, с которыми пришлось столкнуться во время исследований и путях их решения. В итоге нейронные сети утвердились в качестве наиболее эффективного и быстрого решения такого класса задач.