Что делаем:

В Dbrain мы решаем задачу извлечения данных из документов. Раньше нам казалось, что этот домен давно решен, но на практике оказалось, что даже распознать лист А4, заполненный текстом от руки, да ещё и с высокой точностью, не всем под силу. А если нужно найти и структуру в документе, проверить наличие печатей и подписей, то шансов совсем мало.

Наш продукт — это комбинация 20 алгоритмов машинного обучения (CV + NLP), сфокусированных вокруг распознавания и поиска структуры в документах. Мы работаем на рынках СНГ, США и Латинской Америки — в 2020 году прошли Y Combinator и Plug&Play.

Ищем опытного руководителя разработки продукта.

Зона ответственности: управление разработкой backed/frontend/devops частью нашего продукта.

Задачи

  1. Docr — основной набор сервисов, осуществляющий распознание документов.
  2. HITL + Handl — интеграция Docr с разметчиками Яндекс.Толоки, выполняющими функцию допроверки и дообучения системы.

Все решения работают как в облаке, так и в контуре клиента.

Технологии

— Python 3.6+

— Pillow / Imageio / NumPy / SciPy/ Sklearn / Open CV

— Postgres, Redis

— Docker, Docker Swarm, Docker Compose, k8s

— Опыт разработки API (FastAPI, aiohttp)

Обязанности