上記のリンクは、
検索語に「例外処理が必要ない」と100%確信できた場合にのみ、
適用できるスクリプトなので、その点は注意する必要があります。
たとえば、初校としてできた索引ページで、同一の検索語があっても、
それが「本当に同一の検索語かどうか」は、
実際のページにあたって、校正してみないことにはわかりません。
あるいは違う単語であっても、同一の検索語である場合もあります。
自動処理で一つにまとめた検索語が、実は2つの異なるものを差していた、
というようなことはよくあるのですが、
(わかりやすい例だと、「聖書」は、文脈によって旧約と新約があるとか)
1回自動処理でまとめてしまった索引語を、
本文に当たってもういちど分解するのはかなり骨の折れる作業です。
あるいは、『こころ』と『こゝろ』と『心』という作品があって、
『こころ』と『こゝろ』は同一作品だが、
『心』は別の作品という場合があります。
みんな同じヨミを振ってしまうと、一つにまとめられてしまうので、
こういうのも注意が必要でしょうね。
とりわけ人名の場合は、
同一のヨミで違う人、別のヨミで同一人物ということが頻発します。
[12152] 匿名 (2011/06/02 Thu 11:02)