Рейтинг участника сообщества: 14 Подсказка
Сумма лайков и комментариев пользователя
Рейтинг основателя: 222 Подсказка
Количество лайков на запущенных пользователем проектах
На Радаре с 11.04.2025
OcrBot “Протон”
2025-06-17 10:49:32
👋 Привет от команды «Протона»! Теперь в нашем боте доступен режим для разработчиков — вы можете легко подключить API наших моделей для распознавания документов прямо в свои проекты. Активировать его можно в личном кабинете ⚙️ 🎁 Кстати, API можно попробовать бесплатно — каждому пользователю уже доступно 100 страниц для распознавания! Также мы запустили сайт: ocrbot.ru Там доступна веб-версия сервиса, подробная документация по API и краткая информация о нас и проекте. Будем рады вашим отзывам и пожеланиям — пишите на почту: 📩 ocrbot_help@mail.ru
OcrBot “Протон”
2025-06-02 14:41:25
Будем рады, если наше решение сможет решить ваши задачи! А вообще OCR непростая задача. Практика показывает что даже решения на базе огромных LLM не всегда корректно распознают. Особенно если документ имеет сложную структуру и значительные искажения (например фото в перспективе, перекрытие тенями и прочее). Зачастую теряются большие блоки текста и/или выдумывают того чего нету! Поэтому мы выбрали детерминированный подход, используя свои модели, обученные на сканах документов и фото.
OcrBot “Протон”
2025-05-27 17:11:53
Спасибо, Евгений! Очень приятно слышать подобные комментарии!
OcrBot “Протон”
2025-05-27 16:56:32
Привет! Меня зовут Леонид Я сооснователь OcrBot "Протон" - системы распознавания текста для конвертации изображений и сканов в редактируемые документы. Мы очень рады оказаться на ProductRadar! Хочу рассказать о нашем пути к созданию собственного OCR движка для обработки документов Изначально мы разрабатывали систему для заказчика, которая способна обрабатывать любые произвольные документы (строительно-нормативная документация) и извлекать из них данные. Этот путь мы начали в 2021 году с применения tesseract и различных CV алгоритмов и нейросетей для извлечения различных полей из документов с определенной структурой. Нам приходилось обрабатывать и анализировать структуру более чем сотни видов документов. Они обладали различными особенностями: сложными по структуре таблицами, рукописным текстом, низким качеством сканов и другими сложностями. Довольно быстро мы поняли, что существующие решения OCR не обеспечивают требуемой точности распознавания полей документов заказчика. Поэтому мы решили создать свой собственный движок распознавания. Создание движка - долгий путь, который мы прошли: собрали огромное количество данных для обучения, сделали сложные аугментации, имитирующие реальные дефекты, создали собственную архитектуру движка, моделей и реализовали их. В какой-то момент, сравнивая получившийся движок с конкурентами, мы пришли к выводу, что можем применить движок не только для корпоративного решения, но и дать доступ к нему обычным пользователям. Для этого мы решили наделить движок возможностью конвертации в известные редактируемые форматы документов. Как оказалось, такую задачу очень сложно решить для всех возможных случаев входных данных, однако, мы продолжаем совершенствовать систему. На данный момент, можно уверенно утверждать, что для сканов хорошего качества мы выдаем высококачественное распознавание не только самого документа, но и его структуры, включая таблицы. Однако, стоит признать, что для сложных случаев результат может быть не самым лучшим. Помимо этого, мы активно разрабатываем API для интеграции с другими продуктами. Сейчас мы остро нуждаемся в человеке/команде, которые позволят нам раскрыть потенциал нашего продукта на B2C и B2B рынках. Мы будем рады любому сотрудничеству, совету и открыты к конструктивной критике, которые позволят нам развиваться в этом направлении
OcrBot “Протон”
2025-05-26 16:55:52
Спасибо! API в разработке, в ближайшее время выкатим на тест
OcrBot “Протон”
2025-05-26 16:45:06
Добрый день! Мы используем собственный OCR движок с табличным модулем, работающим на детерминированных алгоритмах
OcrBot “Протон”
2025-05-26 14:57:35
API в разработке, выкатим на тест в ближайшие 2-3 недели
Данный сайт использует файлы cookie в целях обеспечения корректной работы сайта. Продолжая использовать сайт, вы принимаете Условия обработки файлов cookie и Политику конфиденциальности. Вы можете отключить обработку файлов cookie в настройках вашего браузера.