Опыт и профессионализм.
Сильные технические, инженерные и математические навыки (PhD in Astrophysics), умение быстро подбирать и осваивать инструменты, модели, методы и алгоритмы для работы с данными и оборудованием благодаря богатому и глубокому опыту в сфере анализа, проектирования и исследований. Высоко цитируемые публикации. Умение работать с научными публикациями.
Приобрел успешный опыт в Data Science, начиная от научных исследований (c 2003), потом практических задач для ИТ инфраструктуры (IoT) инновационного экопарка переработки отходов (с 2015), потом в проектировании функциональных требований к архитектуре и в сборке и разработке ML моделей и подходов для сложных аналитических систем (умного чатбота и базы знаний по налогам, автоматизация анализа наименований и типа организаций, умного озера для документов, АСУДД (с детекторов транспортного потока и видеокамер), модернизации АИС банков, stream анализ задач телекоммуникаций).
Некоторые из моих последних проектов:
NLP анализ категориальных столбцов и построение иерархий и соотношений для АБС Альфабанка в рамках глубокого системного анализа.
Прототипировал бот и решение «умной» базы знаний по налогам где применял инструменты NLP, включая - fuzzy matching, similarity metrics, семантический поиск, ранжирование. ответов, Retrieval-Augmented Generation, Named Entity Recognition. Архитектура базы и внедрение модели для пред-обучения и периодического до-обучения системы.
Тестировал трансформеры для сентиментального анализа вопросов в базу знаний, BERT и GPT для перевода на русский, формирование базы/скелета ответа, распознавание именованных сущностей, формирования диалога.
NLP анализ документов и наименований (en,ru) организаций (содержавших ошибки и вольный формат текста) из разных стран, в том числе включал в себя построение и обновление эталонов, метрики симилярности и кластеризацию, построение дерева соотношений.
Эксперт в языке Python (IDEL, PyCharm & Jupyter) для решения задач по Data Science и для глубокой и интеллектуальной аналитики (больших) данных (также есть опыт веб разработки в Django & Flask).
Применял симилярности, LSTM, автоэнкодеры на проекте с высокочастотными временными рядами для данных банка.
C нуля проектировал и собирал локально и в облаке инфраструктуру для аналитических систем для работы с большими данными различных форматов и включающие ML модели и инструменты для интеллектуального анализа и прогнозирования.
Выпустил 3 группы продвинутых аналитиков данных с очных годичных курсов (авторский курс — есть рекомендательное письмо). Запустил облачную инфраструктуру и 3 месячный потоковый курс (более 100 лаборантов) Аналитики данных с погружением в ML, Data Engineering & Big Data Tools.
Симуляция и визуализация фаз сверхплотной ядерной материи на гибридном суперкопьютере Big Red II.
Опыт математической оптимизации (Linear Optimization, Mixed Integer, Convex & Conic).
Управление и координация крупными коммерческими проектами.
Бизнес анализ, требования, документирование.
А также
* Исследование оптимизации максимального объема на основе тензорных поездов и применение в обучении с подкреплением
* AI Асситестнт оператора установки - обучение с подкреплением RL для оптимизации работы ТЭЦ где данные с датчиков в реальном времени создавали как отрицательную так и положительную связь .
* Машинное обучение для моделирования систем PINN - в академических Научно Исследовательских проектах по астрофизике и автоматизации производства.
* Прогнозирование высокочастотных временных рядов - STL, PCA & K-means, prophet, Isolation Forest, и
Autoencoders для поиска аномалий .
И также:
Data Scientist,
Разработка моделей и код в Python индивидуального BI-модуля из открытого исходного кода (как автономного, так и с полной интеграцией в продукт Campaign Manager (ETL/ELT), архитектура BI-решения с сервисом безопасности, кодирование — исправление и добавление функций, API для BI, анализ больших данных, аналитический конвейер и прототипирование узла, узел ML – интеграция и визуализация
Ответственности: Разработка на Python индивидуального BI-модуля из открытого исходного кода (как автономного, так и с полной интеграцией в продукт Campaign Manager (ETL/ELT), архитектура BI-решения с сервисом безопасности, кодирование — исправление и добавление функций, API для BI, анализ больших данных, аналитический конвейер и прототипирование узлов ETL/ELT.
Инструменты: Python (dask, polars), SQL, PyCharm, Git, GitLab, Docker, OpenShift, Ubuntu 20.04 (VM), YAML, HOCON, JSON
Data Science (+Business Analyst),
Анализ и прогнозировние временных рядов, fuzzy чат-бот, модернизация банковской информационной системы. Устаревшая отчетно-аналитическая система будет модернизирована и преобразована в современную информационную систему на базе озера данных, инструментов EWH и BI.
Ответственности: анализ и сравнение различных методов анализа и прогноза временных рядов
чат-бот-консультант, использующий базу знаний и нечеткое сопоставление
изучение существующей информационной системы и современных ее решений, формулирование требований, проектирование и описание архитектуры и компонент системы.
Инструменты: Python (+ pandas, numpy, seaborn, matplotlib, scikit-learn, statsmodels, skipy…), Jupyter Notebook, Ubuntu, CI/CD, Power BI, Confluence.
Python
LLC DAVER-AI
October 2019 – present time
Преподавание и разработка IT-курсов. Преподавание и разработка курсов для очной академии с филиалами по СНГ. Преподавание разработки на Python, управление проектами в ИТ, аналитика данных и создание курса по машинному обучению.
Ответственности: директор – консультант, педагог и наставник.
Инструменты:, Python (релевантные по топику библиотеки), PyCharm, Jupyter Notebook , PostgreSQL, Git, GitHub, GitLab, C++, Docker, Power BI, Google Analytics, Kanban & Scrum, FORTRAN, Apache Superset, Redash, Google Tag Manager …
Data Engineer
Система слежения, интеллектуальное озеро данных. Разработка аналитической части системы товаросопровождения. Структурировать хранилище и оптимальный запрос для аналитики большого количества XML-документов из транзакционной части системы. Озеро данных для сбора документов из различных источников и предоставления аналитических возможностей, включая ML.
Ответственности: Исследование архитектуры аналитического серверного решения и его оптимизация.
Инструменты: PostgreSQL, Cassandra, SQL, xQuery, Docker, Python, XML, ElasticSearch, eXist, Datalake, Spark, Airflow, Superset, Ranger, Atlas, kafka
Project Manager
DEIP.world
Распределенная публикация журналов с использованием цепочки блоков. Координация с ведущим разработчиком и реализация модулей решения – платформа DLT. Это был короткий проект, быстро завершенный.
Ответственности: Координатор проекта
Инструменты: Confluence, GanttPRO, Figma, DLT, Excel, Agile PM.
Python developer
AR3C International Inc (Canada)
February 2015 – April 2019
Расширение парка эко-переработки. Когда бизнес начал быстро расширяться за счет строительства новых объектов, которые включали линии по переработке пластика, волокна, биомассы, научно-исследовательский центр, экспериментальную теплицу, ферму по выращиванию рыбы и водорослей и, что наиболее важно, систему газификатора. ИТ-инструменты были внедрены во все аспекты новых проектов.
Ответственности: Директор по исследованиям и развитию. Управление проектом. Проектирование и автоматизация системы. Презентации для инвесторов и заявки на гранты. Разработка панелей интерфейсов веб и настольных приложений. Сетчатая сеть. Администрация. Веб-портал.
Инструменты: HTTP, WordPress, Adobe Premiere Pro, PuTTY, Windows, ladder logic, Linux, Bash, Raspbian, SketchUp, HTML, CAD, HTML 5, Python, Project Mananager.