皆さまには関係ない内容なのですが、一応UPしてみましょう↓
readme.txtの内容
〇〇さんへ「OCR変換テキスト見直し修正」の依頼(祈)†
テキスト見直しの作業をやりたいと言ってくれてありがとう。まずは「作業データ一式」を送付します。〇〇さんに「どの書籍の見直しをやりたいか選んでもらう」事も考えたのですが、何が書いてあるか分からない書籍を選べと言われても分からないでしょうから、僕なりの判断で「テスター氏の書籍」の見直しをお願いする事にしました。
テスター氏の書籍は数ある霊関連書籍の中で「ダントツに読んでいておもしろい」と思うからです。〇〇さんがこのキビシイ見直しの作業で心が挫けそうになった時、テスター氏の深くおもしろい文章を読み進める事で心を奮い立たせて作業を続けられるかも知れない、そう思ってこの書籍を選びました。
まずは「作業データ一式」の説明です↓
■(フォルダ)私は霊力の証を見た_スキャン画像
書籍「私は霊力の証を見た」の全ページをフラットべッドスキャナでスキャンし、そのtiff画像をAffinityPhoto上で原寸jpgに書き出した画像群。この画像をGoogleドライブにUPしてOCR変換をおこないました。
この画像内のテキストが「正解テキスト」となりますので、後述するテキストファイルと、このjpg画像を2画面で左右並べて開いて見比べながら作業するのがもっとも効率的と考えますが、〇〇さんのやりやすい方法で作業して頂いて構いません。
■使命_イエスの少年時代_完成版のイメージ.txt
コチラは〇〇さんに「作業の完成イメージ」をつかんでもらう目的で同梱した、既に僕が見直しを完了させているテキストファイルとなります。章ごとに広めの空白を設けて分かりやすくしている部分、どういう風に修正の作業をしているか、等々、参考までにご覧下さい。見るだけ、作業しなくていいテキストファイルです。
■使命_私は霊力の証を見た_OCR変換テキスト原文.txt
コチラは書籍「私は霊力の証を見た」のOCR変換テキストです。コチラと下の編集用テキストは全く同じテキストファイル(コピー)です。こちら原文は予備で同梱したもので、基本的に作業する事はありません。万が一何かあった時に見返すくらいしか使い道はないでしょう。さわらなくていいテキストです。予備です。
■使命_私は霊力の証を見た_編集用テキスト.txt ★★★
こちらが〇〇さんに作業して頂きたいメインの作業ファイルとなります。上記スキャン画像内のテキストと、こちらOCR変換テキストとを見比べて、変換ミスを見つけて修正していく作業となります。縦書きテキストを横書き変換していますので段落もグチャグチャ、文章の冒頭やお尻が別のところに飛んでいたりするところもあります。
ちなみにテキストエディタの全選択、全置換機能を使って主な修正(“―(全角横棒)”を“ – (半角スペース、半角ハイフン、半角スペース)”に変換、“()(半角カッコ)”を“()(全角カッコ)”に変換等々)は既に完了させてあります。
あとは目視で個別に細かい変換ミスを見つけて修正していくというキビシイ作業をおこなわねばなりません。例えばスキャン画像上部に章のタイトルが横書きで記述されていますが、OCR変換テキストにはそれも含まれてしまっていますので、それを削除する。
あとページ番号も含まれてしまっていますのでこれも削除する。さらに時々、本文内に全く存在しない意味不明の記号が変換テキストに含まれている事があります。そういったものも発見次第削除する。
“つ”が“っ”になっていたり、“よ”が“ょ”になっていたり、こういったものも目視で見つけて修正していきます。これらは全選択全置換してしまうと正しい“っ”や“ょ”も置換されてしまい、全文を追加見直ししなければならなくなりますので気を付けて下さい。
さらにこれもごくたまにあるのですが、字がまるっきり欠落しているという事もあります。たとえば「休息し眠っておられる」が「休息しっておられる」といった具合に。こういう部分を発見したら、画像を参考にして正しく修正して下さい。
あと段落もスキャン画像と全く同じようにそろえて頂きたいです。画像内で段落になっている部分をテキストファイル上ではEnter改行、1行あけて下さい。そうしないととても見返せない大変読みにくいテキストになってしまいますので。
GoogleのOCR変換の精度はすさまじく、段落を見ず純粋に文字だけを見れば99%近く正解なのですが(たぶんPythonで構築しているものと予測しますが)所詮機械であり100%は有り得ず、ところどころ誤変換がありますので、それを人間が目視で確認しながら修正し、文章としての体裁を整えていかねばならないのです。大変な作業です。分からない部分があればメール等で質問して頂いても結構です。
■readme.txt
このテキストファイル。
—–
※この作業は「訳者、近藤千雄先生の美しい訳文を忠実にデジタルテキストに書き起こす作業」であり、書籍内の文章の日本語表現のおかしな部分を探して正しい日本語に書き換える作業ではありません。
※スキャン画像のテキスト(アナログ)を、そっくりそのままデジタルに落とし込むのが目的ですので、〇〇さんの一存で「この文章はおかしいからこうしよう」といった修正変更は禁止です。これら霊関連書籍は既に校正校閲が済んでいる完成された書籍ですので。
僕はテキストエディタは長年「Mery」を使用していますが、〇〇さんが普段使用しているテキストエディタで作業して頂いて全く問題ありません。
ちなみに「〆切」はありません。「作業遅いよ、いついつまでにUPしてもらわないと困るよ」といったプレッシャーを僕からかける事はありませんのでご心配なく。ゆっくり作業して頂いて問題ありません。
では、作業の方、よろしくお願い致します(祈)†
—–
たきざわ彰人 Mail
〇〇〇@〇〇〇
たきざわ彰人 WordPress
akito-takizawa.com/
—–
はい、僕以上に忙しい友人がなぜこの地獄とも思える作業を引き受けて下さったのか、未だに首を傾げる部分があるのですが、まぁもっとも友人は70冊全部ではありません、1冊お手伝いして下さるという事ですのでそんなに地獄ではないでしょうから、僕的にも助かりますのでお願いする事としました。
そして友人が少しテキストの作業をお手伝いして下さるという事で、少し僕の時間とパワーに余剰ができる事になりますので「それならアレをやってみるか」という事で、実は脳内でアイデアが存在するのみで全く着手できずにいた「フラーの新規ギミック」があるのです。
しかしそれは考える前から「地獄だろうなぁ」と分かるグチャグチャな変形のギミックで、たぶんこのフラーは描かずに終わるだろうと思っていたモノなのですが「こういう風になったんだからいっそクロッキーとにらめっこだけはしてみるか」と考え始めるようになりました。次回フラー26で新規ギミックのデザインを開始するかも知れません。
「再生」に関する僕の理解に霊団が「正解」と言ってきました。んんん説明してみましょう(祈)†
僕たち肉体をまとって物質界で生活している人間は、たかだか70~80年の尺度でしか自分の人生を考えられませんが、霊界上層界で生活する霊格の高い方々は「人生を永遠という尺度で考えます」僕たち人間に死はありません、人間とは肉体の死後も霊界で永遠に進歩向上の生活を続ける存在ですが、霊界上層界の方々は「知識」としてそれを知っているだけでなく「永遠の人生を自分の霊体で体現している方々」ですから、当然「永遠の尺度」でモノを考える状態がデフォルトの訳です…続きを読む→
「主なブログ」年度別ページ切り出し完了中。自分を助けるための作業となります(祈)†
この作業、ずっとやらなきゃやらなきゃと思っていて全然着手できなかったもので(スンゴイ億劫だったため)ようやくこのようにまとめる事ができました。アナログ絵の固定ページを分割したのと基本的に仕組みは一緒です。トップページを設けてそこから個別ページに飛ばすようにする事によって更新作業を簡略化させて使命遂行の殺人的忙しさから自分を守るのが目的です…続きを読む→