Хорошист: Распознавание пола и ФИО в 1С

«Хорошист» — бесплатный модуль для любой конфигурации на 1С: 8.3. Принимает на вход представление клиента и возвращает данные клиента, разобранные на фамилию, имя, отчество и пол.

Важно. В интернете вы можете найти различные разработки, как платные, так и бесплатные, предназначенные для распознавания и склонения представлений. Ознакомиться с разработками коллег можно здесь.

Для чего нужен «Хорошист»

  • Обогатить данные контактных лиц — добавить к ним пол. Пол можно использовать в дальнейшем для анализа продаж, сегментации email-рассылок и т.д.
  • Обогатить данные контактных лиц и получить отдельно фамилии, имена и отчества. Из них в дальнейшем можно составлять обращения для рассылок, подписи для документов и т.д.
  • Помочь при вводе новых контактов: распознать представление, введенное оператором или загруженное из сторонней системы и на лету заполнить карточку контакта.

Примеры работы

Входные данныеВыходные данные
эллен игоревна АрутунянФ: Арутунян
И: Эллен
О: Игоревна
П: Ж
товкун маринаФ: Товкун
И: Марина
О: -
П: Ж
МаксФ: -
И: Макс
О: -
П: М
Федорович Антон ИгоревичФ: Федорович
И: Антон
О: Игоревич
П: М
Федорович ОлесяФ: Федорович
И: Олеся
О: -
П: Ж
Александр ФедоровичФ: -
И: Александр
О: Федорович
П: М
Василий Павлович Д.Ф: -
И: Василий
О: Павлович
П: М
Василий ШатиловичФ: Шатилович
И: Василий
О: -
П: М

Установка

«Хорошист» состоит из одного общего модуля и двух общих макетов. Поставляется в виде конфигурации. Для установки достаточно выполнить сравнение-объединение с любой конфигурацией на 1С: 8.3.

Совместимость

Модуль не содержит обращений к другим объектам конфигурации, кроме своих общих макетов. Это значит, что » Хорошист» совместим с любыми конфигурациями 1С:

  • 1С: Бухгалтерия
  • 1С: Управление Торговлей
  • 1С: Комплексная автоматизация
  • 1С: Управление нашей фирмой
  • Любая другая конфигурация на 1С 8.3, включая самописные

Конфигурация, в составе которой поставляется » Хорошист», содержит также обработку для тестирования модуля.

Интеграция

После установки из любого места конфигурации можно производить вызовы общего модуля » Хорошиста». Он имеет 2 экспортные функции:

  1. «РаспознатьПредставление(Представление)» — принимает на вход представление физического лица и возвращает структуру данных.
  2. «ДополнитьТаблицуПредставлений(Таблица)» — принимает на вход таблицу значений с колонкой «Представление», куда записаны представления клиентов. Возвращает таблицу с данными.

Я могу помочь вам интегрировать » Хорошист» так, как вам требуется. Для консультации обратитесь ко мне.

Скачать

Вы можете бесплатно скачать конфигурацию «Хорошист» по кнопке ниже. Если вам нужна помощь с внедрением «Хорошиста» или другой морфологической разработки в вашу конфигурацию, обратитесь ко мне.

Я заинтересован в улучшении «Хорошиста», поэтому прошу присылать мне возможные ошибки. Но я не обещаю исправлять ошибки, обусловленные ограничениями — о них ниже.

Ограничения

  • Если вы передаете одно слово — то «Хорошист» считает, что это имя. То есть он не определит пол по одной фамилии, к примеру. Если вы хотите распознавать по-другому, то уточните. Возможно, можно будет под вас адаптировать.
  • Только кириллица. Пояснения не распознаются. Если входящая фраза содержит символы, не являющиеся русскими буквами или точкой, распознавание не производится.
Входные данныеОшибка
Глеб (Иванов?)Найден нераспознаваемый символ: (
Sarah SmithНайден нераспознаваемый символ: S
  • » Хорошист» неплохо работает с сокращенными именами (Макс, Дима, Таня) и в большинстве случаев корректно их распознает. Но он не предназначен для разбора всех возможных видов сокращений. Например, «Танюшка» не распознается. Впрочем, база включена в модуль в открытом виде, ее можно наращивать.
  • Модуль не предназначен для поиска ошибок ввода. Если вводить в него всякую галиматью, его можно обмануть. Проверка на все возможные ошибки ввода дорого стоить с точки зрения производительности.
Входные данныеВыходные данные
Василиса МихайловФ: Михайлов
И: Василиса
О: -
П: Ж
  • Скорость распознавания зависит от частотности имени. Наиболее часто встречающиеся распознаются быстро, другие ищутся по таблицам из макетов. Фамилии и отчества нигде не ищутся, а определяются по характерным признакам или методом исключения.
Входные данныеСкорость обработки, сКомментарий
Андрей Петрович Головач0,027550Частое имя. Сразу понятно, где отчество, где фамилия.
Евгений Васильевич Кац0,020556Частое имя. Сразу понятно, где отчество, где фамилия.
Мария Прокопович 0,014140 Частое имя. Мария — женщина, значит, на «ич» у нас фамилия.
Евгений Шатилович0,276854По слову «Шатилович» сразу не поймешь, это имя или фамилия. Поэтому пришлось анализировать по базе.
Арутунян Эллен0,562975Так сразу не поймешь, где что. Частых имен не видать. Пришлось оба слова искать по базам, причем вначале по мужским, т.к. последняя буква согласная.

При распознавании таблицы представлений среднее время поиска снижается, потому что база для поиска инициализируется один раз и затем используется на протяжении всего прогона.

Контакты

Telegram: victor_7u

Email: aconsultant@list.ru