Вељко Миљанић Свака част на идеји да речник потражиш на Јандексу, а још је фасцинантније да руски торент тракер има овај програм са све patch-ом за уклањање регистрације 🙂.
Елем, успео сам да инсталирам програм у оквиру виртуалне машине, дођем до фајла Docum.nks и декодирам га помоћу скрипти из Гитхаб репозиторијума који сам споменуо у првој поруци.
Речник садржи нешто преко 270.000 одредница, при чему је свака реч засебан HTML документ, експортован из Ворда (или можда Frontpage-a, који је тада био популаран). Ево примера како изгледа једна одредница:
<BODY>
<P class=MsoNormal>
<B><SPAN lang=SR-CYR style="FONT-SIZE: 11pt; mso-ansi-language: SR-CYR">форум</SPAN></B>
<SPAN lang=SR-CYR style="FONT-SIZE: 11pt; mso-ansi-language: SR-CYR"> м лат.<B> 1. а. </B><I>трг у старом Риму, средиште римског јавног живота. —</I> Старе базилике претваране су у хришћанске цркве; стари форуми у нове пијаце (Дуч. Ј., РМС). <B>б. </B><I>јавно место, трг уопште. —</I> Ту је зграду наумио Кршњави изградити ... на великом замишљеном форуму (Баб. Љ. 1, РМС).<BR><B>2. а. </B><I>изабрано или именовано тело које је надлежно за решавање извесних питања и доношење одлука. —</I> Сваки ... члан [Партије] ... мора без поговора да извршује наређења виших партијских форума (Чол., РМС). Сва ова отворена питања требало би да се ријеше пред компетентним форумом (Крл., РМС). <B>б. </B><I>збор, скуп. —</I> Охо — овде је цео форум светитељака (Шапч., РМС).</SPAN>
</P>
</BODY>
Одређене речи су записане са информацијом о акцентима а оно што је интересантно је да су за њих аутори морали да користе посебан фонт који има подршку за акцентоване ћириличне самогласнике да би се то приказало исправно на тадашњим рачунарима.