Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
jey
цитировать
Зарегистрирован: 08.10.2004 Сообщения: 744 Откуда: Latvia
|
OCR | Добавлено: Вс Янв 23, 2005 12:13 pm |
|
|
Кому приходилось сканировать древнерусские тексты? Есть ли рецепт для распознавания в седьмом ABBYY FineReader ? |
|
Вернуться к началу |
|
|
Реклама
|
|
|
lirik [Админ] цитировать
Зарегистрирован: 19.12.2003 Сообщения: 1102 Откуда: Москва
|
| Добавлено: Вс Янв 23, 2005 5:43 pm |
|
|
Его можно обучить, правда у меня не особо получается. Запускаете Распознавание с обучением, и на каждый ему непонятный символ указываете, что подставлять. Довольно долго, потому что в начале придется "переводить" Файнридеру все буквы. |
|
Вернуться к началу |
|
|
jey
цитировать
Зарегистрирован: 08.10.2004 Сообщения: 744 Откуда: Latvia
|
| Добавлено: Вс Янв 23, 2005 5:47 pm |
|
|
А подставлять-то что? Где юсы взять, тиццкая сила? |
|
Вернуться к началу |
|
|
lirik [Админ] цитировать
Зарегистрирован: 19.12.2003 Сообщения: 1102 Откуда: Москва
|
| Добавлено: Вс Янв 23, 2005 6:00 pm |
|
|
только нечто похожее из символьных шрифтов.
Или, как вариант, подставлять какой-л. символ, а потом его заменить ра рисунок юса. Но, имхо, это - фигня. Проще заменять на современные буквы. |
|
Вернуться к началу |
|
|
Север
цитировать
Зарегистрирован: 19.10.2004 Сообщения: 3653
|
| Добавлено: Вс Янв 23, 2005 10:51 pm |
|
|
оно называется то ли королевская TIMES, то ли царская, весь до революционный алфавит. Когда то очень давно где то скачивал. |
|
Вернуться к началу |
|
|
lirik [Админ] цитировать
Зарегистрирован: 19.12.2003 Сообщения: 1102 Откуда: Москва
|
|
Вернуться к началу |
|
|
jey
цитировать
Зарегистрирован: 08.10.2004 Сообщения: 744 Откуда: Latvia
|
| Добавлено: Пн Янв 24, 2005 12:23 am |
|
|
Спасибо, попробую - мабуть и получится. А мабуть и не получится |
|
Вернуться к началу |
|
|
jey
цитировать
Зарегистрирован: 08.10.2004 Сообщения: 744 Откуда: Latvia
|
| Добавлено: Пн Янв 24, 2005 12:41 am |
|
|
Не у всех получается, есть и графические фахты, показывающие это
|
|
Вернуться к началу |
|
|
lirik [Админ] цитировать
Зарегистрирован: 19.12.2003 Сообщения: 1102 Откуда: Москва
|
| Добавлено: Пн Янв 24, 2005 1:21 am |
|
|
jey писал(а): | графические фахты |
Вот иманна! Вот иманна! |
|
Вернуться к началу |
|
|
shuherr
цитировать
Зарегистрирован: 19.01.2005 Сообщения: 31
|
| Добавлено: Пн Янв 24, 2005 1:44 am |
|
|
НА сайте ABBY лежат дополнительные модули. В их состав входит старославянский модуль.
Я натравливаливал этим модулем Файнридер7 на Морозвскую пдф - распознавалось до 80 процентов букв. В кaчестве шрифта выбирал Lucide Unicode.
Думаю если бы скан был более качественный результат был бы много лучше.
Правда у Морозова только ять вроде. Совсем старославянский - люди делятся успешным опытом и с помощью модуля и с помощью обучающего метода. Со шрифтами да, поспрашивать надо - старославянских куча везде валяется, какие правильно сделано - надо понять. |
|
Вернуться к началу |
|
|
jey
цитировать
Зарегистрирован: 08.10.2004 Сообщения: 744 Откуда: Latvia
|
| Добавлено: Пн Фев 21, 2005 5:42 pm |
|
|
Ерунда , однако, получается. Учил этот ФайнРидер, учил - а он бестолковый какой-то ( или я бестолковый ). Даже если научил и сделал эталон, то распознавание трехязычных страниц , включая старославянский, превращается в муку. Либо стандартные языки распознаются нормально, либо обученный, а остальное крякозябрами выходит. Потому как при обучении приходится подставлять соотвествующие буквы из кирилицы или латиницы и после распознавания менять шрифт на старославянский. Но процент брака выходит ужасающий и проще набирать старославянские вставки в тексте вручную, что не есть хорошо. Вот если б была старославянская раскладка для клавиатуры, чтоб при обучении подставлять не заменители из стандартных раскладок, а нормальные старославянские буквы - тогда другое дело. Остается надеятся, что какой-нибудь умелец сие збацает и будет щастие. |
|
Вернуться к началу |
|
|
|