Code for HistoryのWikimedia界隈の活動について


これは、Wikimedia Advent Calendar 2020の12月20日分の記事です。
Advent Calendarの募集文に「今年書いた自慢のウィキペディア記事」みたいなのでもいいと書かれてたので、そのくらいの感じで緩く考えてたら、みんな結構しっかり記事書かれてるのでほんまにええんかいなと思ってるのですが、かといって急に書くことを高尚にできるわけでもないので、私のCode for HistoryがWikimedia界隈でやった活動の紹介をしていきたいと思います。
こういうことをするのは初めてなので、特に紹介したいものは必ずしも2020年内の活動に限らず述べたいと思います。
また、今こんなことに悩んでいますというのも少し述べるので、識者からのアドバイスも欲しいなとも思っています。

まずCode for Historyって何

私のやっている活動で、歴史学にまつわる諸問題をIT技術も使いつつ解決していくものです。
あんまり更新できていませんが、こちらに行っている活動をまとめており、その中でWikimediaにかかわるものをこの記事で採り上げます。

歴史的史跡、事象などのWikipedia記事執筆

私が愛してやまない奈良、館林の寺社、偉人などについてを中心に、Wikipediaの記事にまとめています。
特に館林は、「尾曳稲荷神社」の執筆が2019年12月31日なので、実質2020年から書き始めた形ですね。
館林の「お茶のおばあさん」や、奈良の「鬼界ヶ島」など、あまり他では取り上げられていない面白い対象を見つけて執筆するのを楽しんで行っています。
また、「春日移し」が行われた神社群の記事整備なども取り組んでいますが、最近サボり気味かな?

奈良、館林で今年の自分のイチオシ記事を選ぶとすれば、まず奈良は「村井古道」。
近世、初めて史料批判など科学的視点を持った奈良の地誌「奈良坊目拙解」はじめ、多くの歴史史料をまとめた奈良の歴史の大家ですが、筆名で作品を残していたため、戦後墓が発見されるまでは別人と取り違えられ「平松古道」だと思われていた、不遇の偉人です。
これまでWikipedia記事になっていなかったのが不思議なビッグネームですが、初めて記事にする栄誉をいただきました。
館林では「館林の牛頭天王信仰」。
市神として最初は勧請され、神体が借金の片に取られるなどのハチャメチャな話もありながら、3つの町に祭神が分かれてからも現在の館林まつりにまで系譜が続く夏祭りが長く催行され続けた館林の牛頭天王信仰の歴史をまとめさせていただきました。
残念ながら祭りは受け継がれたものの、信仰としては、明治の神社合祀運動の中で近隣の大きな神社に合祀されてしまい、(もちろん合祀なので今も祀られてはいるものの、実質)信仰としては廃れたような形になってしまってはいますが、今回の執筆範囲では採り上げられなかったものの館林郊外の羽附地域の方では今でも祇園祭を行っている神社もあるようで、次加筆するとすればそう言ったところを加えたいと思っています。
「村井古道」、「館林の牛頭天王信仰」いずれも新しい記事に選出いただきました。

奈良、館林以外では、今年は2回のWikigap(関西館ファイナル)に参加させていただき、女性をエンパワメントする記事の執筆に協力させていただきました。
関西館では館林出身で日本初の女性速記者、「大沢豊子」さんを執筆いたしました。
ファイナルでは、ちょうどその時期、Code for Historyに依頼があり、「松岡朝」さんという日本初の女性アメリカ法学博士号取得者で、福祉活動家だった方の来歴調査を行っていたのですが、その関係でその方に関する資料が手元にとてもあったので、Wikigapでもその方を採り上げさせていただき、Wikigapイベント自身の優秀賞の他、私自身初めての月間新記事賞をいただきました。

2021年の活動としては、奈良や館林をテーマにした執筆は今後も続けるのですが、今年の心残りを解消したいなと思っています。
その心残りとは、やはりCode for Historyに歴史調査依頼が来た案件で、渋谷区の近代建築「岩佐多聞邸」の執筆を行ったのですが、この近代建築、渋谷区に取り壊されようとしていたところ、保存を望む市民の徹底的な調査(決定的な発見には関われなかったものの、私も前述のとおり一部関わらせていただきました)によって、沼田市の名誉市民である久米民之助の旧居であることが突き止められ、沼田市長によって沼田市への移築が決定したのです。
しかしながら、この辺の経緯は私の方が忙しくWikipediaにまだ反映できていないので、これをぜひ2021年に反映したいなと思っています。
また、2021年はぜひ、良質な記事に選出されたいなと考えています。

古地図のPDオープンデータ化

古地図は本来著作権が切れているので、基本的には誰だって自由に使っていいデータのはずなのですが、世の中にネット公開されていたり、あるいは売られていたりする古地図画像は、自由に使えないものが多いです。
申請さえすれば使えるものの申請は強いるものや、そもそもスキャンしただけのものに著作権を主張して再利用を禁止したりしているものさえあります。
基本的には、復元しての精細化や再編集などを行っていない限りは、古地図をスキャン/撮影しても著作権は主張できないはずなのですが...。

まあ、とはいっても法的には問題なくても、所蔵者が公開するかしないかは所蔵者の気持ち次第なので、多くの場合そういった所属者が私的に加えた制限にも仁義を通す意味で素直に従うのですが、一方で誰もが自由に気兼ねせずに使える古地図データも世の中にたくさんあるといいなと思い、私が集めた古地図の類はどんどんスキャンしてPublic Domainでオープンデータ化していっています。

今のところ古地図しかないですが、古写真もおいおい追加していきたいと思っています。

古地図のスキャンには、私のスキャナ環境ではA3までしかスキャンできないため、分割スキャンした画像の接合が必要です。
この接合には@kuniezuさんの神がかったPhotoShopテクニックに助けられており、こちらの奈良町絵図など、非線形に歪み分割スキャンごとの色合いずれも存在した複数スキャン画像を、接合部分のわからない神業のようなテクニックで接合してくれています。
しかしながら、@kuniezuさんも忙しく、相対的に暇だしテクニックもいらないスキャン作業をやり散らかす私の接合依頼を必ずしもさばき切れているわけではないので、もしこの活動に賛同いただき、かつ画像の接合得意だよ、という方はぜひ助けていただけるととても嬉しいです。

また、私はこの活動のために古地図などを蒐集していますが、私の家自身は古い資料の保存などには向いていませんし、古地図をデジタルデータ化した後は私の家に置き続けることが資料にとって良いこととも思えないので、デジタル化後の元史料は適切な資料館などへの資料寄付活動も行っています。
今年は盛岡市の戦前の地図資料を2点、盛岡市図書館に寄贈し、感謝状などもいただきました。

姫路の詩人大塚徹の詩集オープンデータ化

私の祖父大塚徹の詩作品ですが、死後70年を過ぎていないものの、著作権を継承した親族の了承を取り付けたうえで、Wikimedia CommonsのOTRSプロセスを通してpdfをWikimedia CommonsのCC-BY-SA-4.0データとして、さらにWikisourceでテキスト化し、最終的には青空文庫に収録したいなと考えています。

恥ずかしながらこのテキスト化作業、ひたすら退屈な作業なので、遅々として進まずいつ終わるのかという体たらくなのですが、それはそれとして、著作権の切れていないデータをオープンデータ化し、テキスト化まで行う手順を確立できたという意味では、新しい取り組みの先鞭をつけられたと思っています。
同様に著作権が切れていないデータをWikimediaを通じてオープンデータ化するための方法を知りたい方がおられましたら、ご連絡いただければアドバイスいたします。
残念ながら著作権者が分かっていて了承が取れたものだけですが、了承が取れれば何でもオープンデータに即座にできると思ってしまいますが意外とそうでもなくて、Wikimediaコミュニティに「きちんと著作権者に了承が取れている」ということを納得してもらうプロセスが結構面倒くさいのです。
そのプロセスを相当面倒くさいケースでも何度か通してきていますので、もし同じように親族の著作物をオープンデータ化したいと思っておられる方などおられましたら、ぜひご相談ください。

今悩んでいること

今年行ってきたことを中心に、Wikimedia関連で今Code for Historyが行っている活動の説明は以上くらいです。
ここからは、今私がWikimedia界隈で悩んでいること、困っていることについて書きたいと思います。

古典書籍の現代語訳などをWikimediaを通じてオープンデータ化するには?

今、友人などと、先述した村井古道の著作である「奈良曝古今俚諺集」の現代語訳を進めています。
現代語訳をリードしてくれている方にも納得いただいて、CC-BY-SA-4.0でオープンデータ化することも了承いただいているのですが、完成後、さてこれをWikimediaを通じてオープンデータ化する場合、どういう手順がいいのだろうかと悩んでいます。

当然、原文は著作権が切れているので、原文を登録したければWikimedia Commonsに原文pdf追加=>底本にしてWikisourceでテキスト化すればいいのですが、現代語訳はどうしたものか?
私の祖父の作品をWikimedia CommonsのOTRSプロセスを通してオープンデータ化したように、Wikimedia Commonsにpdf版の現代語訳を登録して、翻訳者の了承を取ってOTRSプロセスを通し、Wikisourceでテキスト化という手順を取ると、著作権処理プロセスとしては問題ない感じもしますが、しかし訳する前の原文は古典であっても、その現代語訳は古典ではありませんから、Wikisourceに載せるのが適当なのか?

あるいはWikibooks?それも少し違う気がしますし、またWikibooksで著作権の切れていないデータを、著作権者の了承の元に流し込む場合の処理手続きもよくわかりません。
手順を知っている方、あるいは素案がある方は、ぜひ教えていただけると嬉しいです。

明らかに事実と異なった記述への対応

日本の地方史、市町村史の事情に詳しい友人によると、日本の市町村史などはアカデミックな書物に見えて、昭和以前に書かれたような市町村史はアカデミックなアプローチが必ずしも確立しておらず、社寺の由緒などをそのまま無批判に記述したものも多いそうです。
また、そういった市町村史などをそのまま引いた「〇✕歴史地名辞典」等の類も、よく勘違いされるが辞典の類はアカデミックな書籍ではないので、同じ問題があるとのこと。
なので、そういった時代に市町村史が書かれたまま、その後アカデミックな批判の目が入ることのないまま放置された寺社などでは、学問的には根拠のない由緒などがそのまま疑似アカデミックな情報として、あたかも事実のように扱われているものも多いようです。
私自身、多くの奈良の寺社のWikipedia記事を、そういった時代の市史や県史や歴史地名辞典などを元に、まさか複数の書籍が根拠のあやふやな情報を元にかかれているとは思わず執筆しており、それらは当然現在もそのままになっています。

しかしその後、十種以上の複数の奈良の地誌や日記資料などを読み、それも先述の「奈良坊目拙解」のようなメジャーなものだけでなく、入手するために十万円弱近く図書館に支払わないと目にできないようなマイナーなもの含め目を通すと、そういった近代以降に成立した由緒には、近世以前の記録には全く根拠がなく、それどころか同じ神社で明治、大正、昭和でも由緒が全く異なるものなどが平気であることがわかりました。
当然、昭和のポッと出の由緒を元に書かれた市史、県史、歴史辞典、さらにそれを元に書かれた今のWikipediaの記述は、本当の来歴とは程遠いものになっています。

しかしながら、当然皆様ご存じの通り、Wikipediaは検証不可能な個人の未発表の研究を載せられる場ではありませんから、これを修正しようと思えば、研究結果を出版、それも可能ならば単なる自己出版とかではなく、査読されるアカデミックな学術論文などで言及されたものを元にして、初めてWikipedia記事は修正できます。
とはいえ、たかがいくつかの神社の来歴など、追及したところで学問的業績になるわけもなく、普通のアカデミックの研究者などは相手にしてくれません。
実際、歴史を生業とする研究者の友人などにも、研究対象にして修正してくれないかと頼んでみましたが、断られました。
誰もやらないのであれば、門外漢であっても私がやるしかありません。
既に歴史学会の会員にもなり、論文を出すための状況も整えましたが、文系のアカデミックな手法には素人な私がまともに受け入れられる論文を書いて採用されるようになるにはどの程度の期間がかかるのかわからず、年単位で労力が必要なのだろうなと、今から気が遠くなりそうです。

これは悩みでアドバイスを受けたいというよりは、もうやるべきことはわかっていてその壁の高さに絶望的になっているだけですが、しかし間違った内容を書く時は1日や2日で簡単に書き散らかせたのに、正しい内容に書き直そうとすると年単位で苦しむとか、本当に間違った情報が拡散した時のそれを改めるための労力の大変さを実感しています。
よくデマをまくのは簡単、デマを正すのは恐ろしい労力がいると言いますが、まさにそれで、どんなことでもデマはダメ、絶対!というのを改めて今訴えたい気分です。

================================

以上、Code for HistoryのWikimedia周りの活動と悩みなどを紹介させてもらいました。
2021年も新しい挑戦をしていきたいと思っていますので、ご期待ください!