log_in_buttonとlogin_button、どちらが正しい? それ、Ngram Viewerに聞こう


ログインボタンって、変数名にすると log_in_button かな、 login_button かな?

login_button だね。Google先生、ありがとう。

user_data の配列作らなきゃ。名付けて…… user_datas

あ、dataはsつけちゃダメだったね。Google先生、ごめんなさい。

Google Books Ngram Viewerとは

Google Books Ngram Viewer は、Googleが公開している検索ツール。
名前からも分かるとおり、普通のGoogle検索とは違って、「本のフレーズ検索」に特化したツールである。
数百万冊にも及ぶ本をスキャン・構文解析して、どんなフレーズがどんな頻度で出現するかのトレンドを検索できるようにするという、まさにGoogleスケールのプロジェクトだ。
(Ngram (エヌ・グラム) というのは単語の連なりとか、フレーズとかをカッコつけて言っただけのものなので、別に身構える必要はない。)

例えば、次のグラフ:


(artificial intelligence vs machine learning)

Artificial intelligence (人工知能) というフレーズは1980年代から登場頻度が上がりはじめ、1988年頃にピークをむかえたあとに10年ほど横ばいを続け、2012年頃からまた右肩上がりになっていると分かる。
時を同じくして、machine learning (機械学習) というフレーズがartificial intelligenceを追い抜いて、急成長を遂げているのも分かる。
このように、時系列に沿って言葉やフレーズのトレンドを比べるときに使うのが主な使い方だが、コードを書いているときによくある「どっちの英語が正しいんだっけ?」問題をサクッと解決してくれるツールであったりもする。

実用例

information vs informations


information vs informations

Dataと同じく、情報を専門に扱う人間にとって切っても切れない関係の単語だが、不可算名詞なのでinformationsとはならない。

user name vs username


user name vs username

大きな差はあるものの、user nameというフレーズも出現することにはするので、こちらが間違っているとは言い難い。
既存のコードで user_name とか userName とか使われていたらそれにならっても良さそうかな。
使われていなかったら、長いものに巻かれて username としておこう。

WebView vs Webview


WebView vs Webview

大文字・小文字の区別をして検索することもできるので、こういう比較もできる。

meta data vs metadata


meta data vs metadata

ぼく「メタデータは1単語だから、スネークケースなら metadata 、キャメルケースなら Metadata だね。」
SQLAlchemy「は?」

from sqlalchemy import *

metadata = MetaData()

(抜粋: SQLAlchemy 1.4 Documentation

ライブラリがこういう変化球を投げてきたら、思考停止してそっちに合わせるのが無難かな。

referrer vs referer


referrer vs referer

悪名高きHTTPヘッダ Referer
間違ったスペルのまま仕様が通ってしまったからといって、あなたまでスペルを間違える必要はないのでは?

an SQL vs a SQL


an SQL vs a SQL

SQLは1文字ずつ「エス・キュー・エル」と発音するのが僕の周りでは主流だが、英語の講演とかYouTube動画とかを聞いているとほとんどの人が「シークエル (sequel)」と発音する。
母音から始まる発音の場合 (an SQL ) と子音から始まる発音の場合 (a SQL) の頻度を比較すると、上のような面白い結果になった。
1980年から1995年の間は「エス・キュー・エル」の発音が優勢だったが、1995年頃から急激に「シークエル」の発音の頻度が上昇し、それから今に至るまで優勢を保っている。
もっとも、最近では大きな差はなくなってきているが。

つまり、結局どちらが正しいか?
味気ない結論だが、「文化・環境に合わせる」のが正解だろう。
変数名に a とか an の冠詞をつけるのは一般的でないし、英語でコメントを書くとき以外は悩む必要もなさそうだが。

あとがき

ここで紹介した例は2つのフレーズの比較のみだが、3つ以上の比較もできるし、その他いろいろな検索オプションがあるので、色々と実験してみるのもいいだろう:


(Python・JavaScript・Java・C・Rubyの比較

こういうグラフを作って、Pythonの伸びっぷりを視覚化したりするのも一興。
あくまで、「英語圏の出版業界における伸び」だが。

また、グラフの下の Search in Google Books 欄のリンクから、検索したフレーズが実際に本の中で使われている部分を見に行くこともできる。
工夫次第で色々な使い方ができるので、あなたの情報探索の道具箱に入れておくことをオススメする。