Разделы презентаций


Голосовое управление в облачных веб-проектах с помощью Яндекс.Станции и

Содержание

Похоже, что-то не так…Май 2011, 150 лет MITСимпозиум “Brains, Minds and Machines”Диспут Ноама Хомски и Питера Норвига

Слайды и текст этой презентации

Слайд 1Голосовое управление в облачных веб-проектах с помощью «Яндекс.Станции» и Google

Assistant
Александр Сербул
Руководитель направления

Голосовое управление в облачных веб-проектах с помощью «Яндекс.Станции» и Google AssistantАлександр СербулРуководитель направления

Слайд 2Похоже, что-то не так…
Май 2011, 150 лет MIT
Симпозиум “Brains, Minds

and Machines”
Диспут Ноама Хомски и Питера Норвига

Похоже, что-то не так…Май 2011, 150 лет MITСимпозиум “Brains, Minds and Machines”Диспут Ноама Хомски и Питера Норвига

Слайд 3Все летит в …
Ученые в ступоре! 20 отжиманий и 50

приседаний, плз.

Хватит кодить! В голову можно не только кушать, но

ей можно … думать!

Все летит в …Ученые в ступоре! 20 отжиманий и 50 приседаний, плз.Хватит кодить! В голову можно не

Слайд 4Подтянулись GPU и железо
Универсальные GPU
CUDA
Работа с тензорами
Диски, кластера: Spark, Hadoop/HDFS,

Amazon s3
Языки: Scala

Подтянулись GPU и железоУниверсальные GPUCUDAРабота с тензорамиДиски, кластера: Spark, Hadoop/HDFS, Amazon s3Языки: Scala

Слайд 5Парад бесплатных фреймворков
TensorFlow (Google)
Torch
Theano
Keras
Deeplearning4j
CNTK (Microsoft)
DSSTNE (Amazon)
Caffe

Парад бесплатных фреймворковTensorFlow (Google)TorchTheanoKerasDeeplearning4jCNTK (Microsoft)DSSTNE (Amazon)Caffe

Слайд 6Вендоры скупают ученых
Facebook (Yann LeCun)
Baidu (Andrew Ng, уже правда уходит,

достали тупить  )
Google (Ian Goodfellow)
SalesForce (Richard Socher)
openai.com …

Вендоры скупают ученыхFacebook (Yann LeCun)Baidu (Andrew Ng, уже правда уходит, достали тупить  )Google (Ian Goodfellow)SalesForce (Richard

Слайд 7И майнеры тоже подоспели …

И майнеры тоже подоспели …

Слайд 9Как работает нейронка?
Все просто – почти как наш мозг 
Вспомните

школьные годы – и все станет понятно

www.deeplearningbook.org

Как работает нейронка?Все просто – почти как наш мозг Вспомните школьные годы – и все станет понятноwww.deeplearningbook.org

Слайд 10Фантастические интерьеры
https://habrahabr.ru/company/mailru/blog/338248/

Фантастические интерьерыhttps://habrahabr.ru/company/mailru/blog/338248/

Слайд 11Изменение возраста
https://habrahabr.ru/company/mailru/blog/338248/

Изменение возрастаhttps://habrahabr.ru/company/mailru/blog/338248/

Слайд 12Верстка по дизайну
pix2code

Верстка по дизайнуpix2code

Слайд 13Борьба с заболеваниями
https://habrahabr.ru/company/mailru/blog/325908/

Борьба с заболеваниямиhttps://habrahabr.ru/company/mailru/blog/325908/

Слайд 14Чтение по губам
Сеть без звука читает по губам – уже

2 раза лучше человека




https://habrahabr.ru/company/mailru/blog/338248/

Чтение по губамСеть без звука читает по губам – уже 2 раза лучше человекаhttps://habrahabr.ru/company/mailru/blog/338248/

Слайд 15Google Neural Machine Translation
https://habrahabr.ru/company/mailru/blog/338248/

Google Neural Machine Translationhttps://habrahabr.ru/company/mailru/blog/338248/

Слайд 16Чатботы

Чатботы

Слайд 17Чатботы – технологии «попроще»
Регулярные выражения
Примитивные «движки» с правилами
Заполнение цепочки форм
Вычленение

фактов из теста и выполнение действий
api.ai – простой движок на

веб-хуках
Чатботы – технологии «попроще»Регулярные выраженияПримитивные «движки» с правиламиЗаполнение цепочки формВычленение фактов из теста и выполнение действийapi.ai –

Слайд 18Чатботы – фреймворки
api.ai
Amazon Alexa
Microsoft Bot Framework

Чатботы – фреймворкиapi.aiAmazon AlexaMicrosoft Bot Framework

Слайд 19Чатботы – фреймворки, элементы
Google Cloud Natural Language API, Amazon Comprehend
Анализ

тональности текста
Выявление намерения (категория)
Вычленение сущностей (личности, места, даты и т.п.)
Синтаксический

разбор (части речи)
Ключевые слова
Определение языков



Чатботы – фреймворки, элементыGoogle Cloud Natural Language API, Amazon ComprehendАнализ тональности текстаВыявление намерения (категория)Вычленение сущностей (личности, места,

Слайд 20Чатботы – элементы
Google SyntaxNet, Parsey’s Cousins
>40 языков




Чатботы – элементыGoogle SyntaxNet, Parsey’s Cousins>40 языков

Слайд 21Чатботы – элементы
Яндекс, Томита.Парсер. Вычленение фактов.




Чатботы – элементыЯндекс, Томита.Парсер. Вычленение фактов.

Слайд 22Deeppavlov.ai
https://deeppavlov.ai
http://ipavlov.ai
Очень интересные, мощные архитектуры моделей и нейросетей
Есть готовые «русскоязычные» модели
Отличная

поддержка на форуме: https://forum.ipavlov.ai





Deeppavlov.aihttps://deeppavlov.aihttp://ipavlov.aiОчень интересные, мощные архитектуры моделей и нейросетейЕсть готовые «русскоязычные» моделиОтличная поддержка на форуме: https://forum.ipavlov.ai

Слайд 23Deeppavlov.ai - возможности
Определение намерения, тональности
Морфологическая разметка (11 языков, в т.ч.

русский)!
Определение сущностей (имена, места, организации, даты, количества) с быстрым стартом
Семантическое

ранжирование!
Коррекция правописания
Ответ на вопрос цитатой из контекста







Deeppavlov.ai - возможностиОпределение намерения, тональностиМорфологическая разметка (11 языков, в т.ч. русский)!Определение сущностей (имена, места, организации, даты, количества)

Слайд 24Deeppavlov.ai – выполнение текстовых команд

Deeppavlov.ai – выполнение текстовых команд

Слайд 25Deeppavlov.ai – ответ фактами из базы знаний

Deeppavlov.ai – ответ фактами из базы знаний

Слайд 26Чатботы – элементы
Морфологический словарь?
Словарь синонимов?
Семантический граф?
Гипонимы/гиперонимы
Устранение неоднозначностей…
Национальный корпус русского языка…


Чатботы – элементыМорфологический словарь?Словарь синонимов?Семантический граф?Гипонимы/гиперонимыУстранение неоднозначностей…Национальный корпус русского языка…

Слайд 27Чатботы – кейсы применения
Узкая специализация: пиццерия, магазин, справка (ИНН), база

знаний, распознавание изображений
Сбор фактов и выполнение действия (заказ пиццы, билета)
«Точечное»

машинное обучение: анализ тональности, классификация, вычленение фактов

Чатботы – кейсы примененияУзкая специализация: пиццерия, магазин, справка (ИНН), база знаний, распознавание изображенийСбор фактов и выполнение действия

Слайд 28Чатботы – кейсы на Битрикс24
Можно использовать в открытых линиях в

>100к компаний Битрикс24
Можно использовать в CRM
Можно использовать в мессенджере
Современная, удобная

платформа для интеграции
Чатботы – кейсы на Битрикс24Можно использовать в открытых линиях в >100к компаний Битрикс24Можно использовать в CRMМожно использовать

Слайд 29Бот плафторма Битрикс24
Можно писать на любом языке
Неплохая документация с примерами
Есть

заготовка на PHP
Веб-хуки

Бот плафторма Битрикс24Можно писать на любом языкеНеплохая документация с примерамиЕсть заготовка на PHPВеб-хуки

Слайд 30Наши эксперименты
Наши эксперименты:

Ф.М. Достоевский, "Преступление и наказание“

Число слоев сети:

2
Число нейронов в каждом слое: 400
Коэффициент встряхивания "мозгов"

(dropout): чуть больше единицы
Память сети: 50 символов назад
Число параметров, которые мы учим - меньше миллиона.
Наши экспериментыНаши эксперименты:Ф.М. Достоевский,

Слайд 31Наши эксперименты:

Л.Н. Толстой, "Война и мир"

Число слоев сети: 3


Число нейронов в каждом слое: 400
Коэффициент встряхивания "мозгов" (dropout):

чуть больше единицы
Память сети: 150 символов назад
Число параметров, которые мы учим - несколько миллионов

Наши эксперименты

Наши эксперименты:Л.Н. Толстой,

Слайд 32Наши эксперименты:

Код ядра Битрикс

3-х слойная сеть, размер слоя: 400

нейронов, несколько миллионов параметров, память: 150 символов назад, обучение -

ночь

Наши эксперименты

Наши эксперименты:Код ядра Битрикс 3-х слойная сеть, размер слоя: 400 нейронов, несколько миллионов параметров, память: 150 символов

Слайд 33«Нейробот»
Embedding+encoding -
каскад сжатия вопроса/контекста
(RNN/FF/CNN, softsign, adam)
Слой векторного умножения
(dot product) либо

другой kernel
Корректирующий слой
(feed forward + softmax)
Ответ сети: похожесть вопроса и ответа

(0-1)

TF-IDF/Ngram – токенизация

TF-IDF/Ngram - токенизация

Embedding+encoding -
каскад сжатия ответа
(RNN/FF/CNN, softsign, adam)

"Вопрос"

"Ответ"

Кластер веб-серверов,
Кэширование, REST-API
GPUs (TitanX)

Возможные ответы
на контекст

Глубокая нейронная сеть
с двумя входами и одним выходом с адаптивной архитектурой.

Внутри сети происходит совмещение
семантических пространств вопросов и ответов.

В 2017 году – сделали совместный пилот с мэрией Москвы

«Нейробот»Embedding+encoding -каскад сжатия вопроса/контекста(RNN/FF/CNN, softsign, adam)Слой векторного умножения(dot product) либо другой kernelКорректирующий слой(feed forward + softmax)Ответ сети:

Слайд 34Голосовое управление

Голосовое управление

Слайд 35Голос вместо текста
Распознавание речи через нейросеть
Понимание неоднозначностей
Яндекс, Google, Amazon

Голос вместо текстаРаспознавание речи через нейросетьПонимание неоднозначностейЯндекс, Google, Amazon

Слайд 36Пример софта для управления

Пример софта для управления

Слайд 37Возможности - Сообщения

Возможности - Сообщения

Слайд 38Возможности - События

Возможности - События

Слайд 39Возможности - Задачи

Возможности - Задачи

Слайд 40Подключение – «Алиса» на портале Битрикс24

Подключение – «Алиса» на портале Битрикс24

Слайд 41Подключение – «Google Ассистент» на портале Битрикс24

Подключение – «Google Ассистент» на портале Битрикс24

Слайд 42«Алиса», отправка сообщения на портале Битрикс24

«Алиса», отправка сообщения на портале Битрикс24

Слайд 43«Алиса», создание Задачи на портале Битрикс24

«Алиса», создание Задачи на портале Битрикс24

Слайд 44«Алиса», создание События на портале Битрикс24

«Алиса», создание События на портале Битрикс24

Слайд 45«Google Ассистент», создание События на портале Битрикс24

«Google Ассистент», создание События на портале Битрикс24

Слайд 46Как управлять AI проектом и прийти к цели?

Как управлять AI проектом и прийти к цели?

Слайд 47Вы – руководитель проекта
Нужно быстро проверить, что идея работает
Нужно объяснить

клиенту/ам, в чем польза решения
Нужно иметь возможность поддерживать и развивать

решение
Нужно уложиться в сроки и бюджет
Нужно подобрать людей в команду


Вы – руководитель проектаНужно быстро проверить, что идея работаетНужно объяснить клиенту/ам, в чем польза решенияНужно иметь возможность

Слайд 48Ваша компетенция
Вы слышали про математическую статистику … на гуманитарном факультете
От

фразы «линейная алгебра» у вас болит голова и ощущается привкус

крови во рту
Вы не писали код, никогда
Вы не сисадминили сервера
Вы не понимаете, как работают алгоритмы машинного обучения


Ваша компетенцияВы слышали про математическую статистику … на гуманитарном факультетеОт фразы «линейная алгебра» у вас болит голова

Слайд 49Вы свободны. Спасибо за внимание!

Вы свободны. Спасибо за внимание!

Слайд 50Закон Парето

Закон Парето

Слайд 51Огнестрельное оружие и единоборства

Огнестрельное оружие и единоборства

Слайд 52«Дурака работа любит»

«Дурака работа любит»

Слайд 53Ключевые качества IT-менеджера
Позитивная энергетика, умение вдохновлять и мотивировать
Ответственность
Коммуникабельность
Талант бережливости и

уменьшения работы
Знание и применение очень простых «хитростей» Agile-методологий
СИСТЕМНЫЙ ПОДХОД (желание

строго описать процесс, делегировать и уйти на повышение)
Ключевые качества IT-менеджераПозитивная энергетика, умение вдохновлять и мотивироватьОтветственностьКоммуникабельностьТалант бережливости и уменьшения работыЗнание и применение очень простых «хитростей»

Слайд 54Что Вам нужно прямо сейчас?
Найти эксперта-математика, который поможет объяснить суть

идеи/модели на пальцах
Научиться объяснять пользу идеи таким же, как вы
Реализовать

простейший рабочий прототип
Двигаться маленькими, измеримыми шагами
Постоянно общаться с клиентами, пытаясь понять объем принесенной пользы

Что Вам нужно прямо сейчас?Найти эксперта-математика, который поможет объяснить суть идеи/модели на пальцахНаучиться объяснять пользу идеи таким

Слайд 55Все начинается с культуры сбора, очистки и хранения ДАННЫХ

Все начинается с культуры сбора, очистки и хранения ДАННЫХ

Слайд 56Где взять данные и где их хранить?
Культура сбора, очистки и

хранения данных. Сисадмины или облако.
Данные – нужно собирать из разных

источников
Данные – можно купить
Данных будет, обычно, много
Данные нужно правильно хранить: ClickHouse, Amazon RedShift, Vertica, Druid, Impala, Presto и т.д.


Где взять данные и где их хранить?Культура сбора, очистки и хранения данных. Сисадмины или облако.Данные – нужно

Слайд 57Чем AI/ML проекты отличаются от … разработки веб-сайта на PHP/Битрикс/Битрикс24?
Нужно

знать основы математической статистики, теории вероятностей и линейной алгебры, теорему

Байеса и ее применение
Нужно знать дополнительные языки: python
Нужно уметь создавать прототипы и презентации в Jupyter Notebook
Нужно «набить руку» в библиотеках: pandas, scikit-learn, seaborn, matplotlib
Иногда полезно знание экосистемы для языка R
В сложных случаях придется знать библиотеки: Keras, TensorFlow, Torch и аналоги
Пригодится работа с кластерами Spark

Чем AI/ML проекты отличаются от …  разработки веб-сайта на PHP/Битрикс/Битрикс24?Нужно знать основы математической статистики, теории вероятностей

Слайд 58Инженеры-программисты – провалят AI/ML-проект

Инженеры-программисты – провалят AI/ML-проект

Слайд 59Чем AI/ML проекты отличаются от … разработки веб-сайта на PHP/Битрикс/Битрикс24?
В

коде инженеров-программистов обычно: чистота, порядок, системность
Пишутся unit и интеграционные тесты
Объем

кода тестов = объему написанного кода проекта
Название классов, функций, переменных, модулей, файлов – имеют смысл
Поддерживается единый CodeStyle
Математики – известные «г..нокодеры»
В исследовательских проектах на Python – потоки сознания со слабой структурой и сильными эмоциями
Нужно системно учить инженерным практикам и алгоритмам новоиспеченных «датасатанистов»

Чем AI/ML проекты отличаются от …  разработки веб-сайта на PHP/Битрикс/Битрикс24?В коде инженеров-программистов обычно: чистота, порядок, системностьПишутся

Слайд 60«Датасатанисты» – провалят AI/ML-проект

«Датасатанисты» – провалят AI/ML-проект

Слайд 61Чем AI/ML проекты отличаются от … разработки веб-сайта на PHP/Битрикс/Битрикс24?
Машинное

обучение создает «программу» на основе данных
Написать руками такую «программу» -

практически невозможно или очень сложно и дорого
Новые данные –> новая «программа»  например хуже или лучше
Чем больше данных, тем, обычно, «программа» лучше


Чем AI/ML проекты отличаются от …  разработки веб-сайта на PHP/Битрикс/Битрикс24?Машинное обучение создает «программу» на основе данныхНаписать

Слайд 62Ингредиенты успешного AI/ML проекта
Данные
Бесплатные библиотеки
«Программа» = автоматически обученный на данных алгоритм
Инженер-программист
Аналитик/Дата

-сайнтист
Сисадмин/админ БД/инженер по данным
Сервис, например API
Клиент/
Заказчик
Инженер-программист
Сисадмин с опытом, возможно DevOps

Ингредиенты успешного AI/ML проектаДанныеБесплатные библиотеки«Программа» = автоматически обученный на данных алгоритмИнженер-программистАналитик/Дата -сайнтистСисадмин/админ БД/инженер по даннымСервис, например APIКлиент/ЗаказчикИнженер-программистСисадмин

Слайд 63Культура сбора данных + >=1 хороший программист + >=1 аналитик

данных

Культура сбора данных + >=1 хороший программист + >=1 аналитик данных

Слайд 64Наши AI проекты …
рекомендательная система для десятков тысяч интернет-магазинов (Apache

Spark, Apache Lucene, Apache Mahout)
чатботы (Deeplearning4j)
распознавание лиц клиентов: рабочий

день, скидки в CRM
классификатор обращений в техподдержку (нейросеть, java, Deeplearning4j)

технологический стек компании: PHP, JavaScript, C++, Java.
технологический стек AI-проектов: python, Jupyter Notebooks, scikit-learn, anaconda, pandas, seaborn… java
Наши AI проекты …рекомендательная система для десятков тысяч интернет-магазинов (Apache Spark, Apache Lucene, Apache Mahout) чатботы (Deeplearning4j)распознавание

Слайд 65 Новый проект - сервис скоринга CRM в Битрикс24

Новый проект - сервис скоринга CRM в Битрикс24

Слайд 66Способы быстро запустить проект в облаке

Способы быстро запустить проект в облаке

Слайд 67Сервис «Amazon Machine Learning»
Только логистическая регрессия
Работа через API
Простой язык для

feature engineering
Простая визуализация и контроль качества классификаторов (binary, multiclass) и

регрессии
Масштабирование
Сервис «Amazon Machine Learning»Только логистическая регрессияРабота через APIПростой язык для feature engineeringПростая визуализация и контроль качества классификаторов

Слайд 68Сервис «Amazon Sage Maker»
Немало встроенных МАСШТАБИРУЕМЫХ алгоритмов
Поддержка работы с Jupiter

Notebooks (kernels: Python 2 and 3, Apache MXNet, TensorFlow, and

PySpark)
Авто-масштабирование, развертывание, A/B-тестирование
Оплата только за хостинг железа для моделей
Можно поднимать машины с GPU

Сервис «Amazon Sage Maker»Немало встроенных МАСШТАБИРУЕМЫХ алгоритмовПоддержка работы с Jupiter Notebooks (kernels: Python 2 and 3, Apache

Слайд 69Где брать людей в команду?
Акселераторы, хакатоны
Физтех-акселератор (pha.vc)
Сообщество «OpenDataScience» (ods.ai)
aione.world, «ScienceGuide»

Синергия,

синергия, синергия…


Где брать людей в команду?Акселераторы, хакатоныФизтех-акселератор (pha.vc)Сообщество «OpenDataScience» (ods.ai)aione.world, «ScienceGuide»Синергия, синергия, синергия…

Слайд 70Где брать людей в команду?
Бигдата: хорошие программисты и опытные сисадмины

– 1 штука на проект
Создание/тюнинг моделей: физматы – 1 штука

на отдел
Product owner с обновленным мозгом – 1 штука на проект(ы)
Менеджеры – 1024 килограмм 
python, java, unix, spark, scala, julia

Где брать людей в команду?Бигдата: хорошие программисты и опытные сисадмины – 1 штука на проектСоздание/тюнинг моделей: физматы

Слайд 71 Спасибо за внимание!
Вопросы?

Александр Сербул
@AlexSerbul

Alexandr Serbul
serbul@1c-bitrix.ru

Спасибо за внимание! Вопросы?Александр Сербул   @AlexSerbul   Alexandr Serbulserbul@1c-bitrix.ru

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика