https://frosthead.com

ミリオンワードマーチ

以前は、単語であったか、単語でなかったかに関する専門家の情報源は、その学校時代の定番である辞書でした。 American Heritage、Webster's Third、オックスフォード英語:ゲームには信頼できるプレイヤーが数人いました。

しかし、それらのプレーヤーが優位を失っている場合はどうでしょうか?

「ステイカチオン」という言葉を使います。 ステイケーションは、自宅で休暇を過ごすことを意味し、最近ニューヨークタイムズ、USAトゥデイ 、およびMSNBCに登場しました しかし、辞書にすぐに登場することはまずないでしょう。 同じことが「ブラケット学」(NCAAマーチマッドネスベットの科学)Facebookとウィキペディアにも当てはまります。

「最も顕著な」という言葉をカバーしようとしています」と、アメリカ遺産辞典の編集長を務めるジョー・ピケットは言います。「教育を受けた素人は何を知る必要がありますか?」

辞書を作成する人は、辞書編集者(「辞書の作成者または編集者。」ありがとう、Merriam-Webster)として知られています。 また、辞書のWebサイトの次の編集または更新の前に、どの新しい単語を認証し、どの単語をトスするかを選択するための実績のある方法があります。

辞書の編集者グループは、特定のサブジェクト領域を監視し、新しい単語が取得したヒットを記録します。 「ヒット」とは、本、新聞、またはWebサイトでの言及です。 次に、ヒットをデータベースに入れ、新しい用語を既存の単語と比較します。 そのため、Facebookはブランド名ですが、資格はありませんが、シェークスピアの戯曲のすべての単語はそうです(cap-a-pie(「頭から足まで」)およびfardel(「負担」)を含む)。 シェークスピアは、創造的な言語学の祖父であり、1, 700以上の単語を発明しました。 それらはすべて、要約されていない辞書に表示されます。

辞書は、技術的に難しすぎる(最も頑固な「グレイズアナトミー」ファンであっても、乳腺刺激ホルモンが何であるかを知る必要がない)または若すぎる(ステイケーション)ために単語を拒否します。

ブランド名(コーラ、Facebook、ウィキペディア)またはほとんどの外国語の語句はカウントしません。

「我々はウィキペディアになろうとはしていない」とピケットは言った。

だから誰ですか? 英語を話す人が日常的に使用する単語を誰が追跡し、数え、分類していますか?

テキサス州オースティンは、過去5年間単語を追跡しています。 独自の専門家チームと独自のアルゴリズムを使用して、英語は98分ごとに新しい単語を追加すると言います。 これは、世界に900, 000以上の英語の単語があり、2009年4月に100万分の1が出現することを意味します。

対照的に、ほとんどの標準的な辞書には約200, 000語、要約されていない辞書には約600, 000語があります。

しかし、モニターはその数を確信しており、100万ワードへのカウントダウンであるミリオンワードマーチを開始しました。

「私たちは中英語に戻り、単語の定義は「話された思考」であることがわかりました」と、モニターの社長兼チーフワードアナリスト、ポールJJパヤックは言いました。私、それは本当の言葉です。」

Payackは、ステイケーション、Facebook、Wikipediaを単語としてカウントします。 しかし、彼はいくつかの古いルールも守っています。 たとえば、名詞と動詞の両方の単語(「水」など)は1回だけカウントされます。 何十万人もいるので、彼は化学物質の名前をすべて数えているわけではありません。

モニターは単語を特定すると、その単語を追跡し、その単語がどこに現れるかを監視します。 その測定に基づいて、彼らは単語が「勢い」を持っているかどうか、基本的には人気が高まっているか、それとも言語世界のワンヒットワンダーかどうかを決定します。

一見、これは辞書のシステムによく似ています。

「これは古い[方法]と同じで、新しい現実を認識するだけです」とPayack氏は言います。 モニターの方法は、オンライン引用により多くの重みを与えます。

しかし、Payackの「新しい現実」は本当に本当ですか? 彼は、情報の速い流れとグローバルな英語の出現により、人々の言葉の使い方が変わったと主張しています。 そして、人々が使用する言葉と辞書に現れる言葉との間のギャップが増加しているかもしれない。

「インターネットに何かが入ると、まるで反響室のようになります」とパヤックは言います。 1991年に最初のWebブラウザが登場して以来、インターネットは英語に多くの単語(ドットコム、ブログ)を追加し、これらの単語をすばやく追加しました。 Webは既存の言葉を新しい耳に持ってきました。

「90年代半ばに、1ワードにつき数千件のブラウザヒットがあったため、入力する傾向がありました。今ではしきい値が変更されました」とPickett氏は言います。 「あいまいな言葉や表現の証拠はたくさんあります。」

しかし、辞書はキャッチアップの再生に使用されます。 結局のところ、造語される前に単語を定義するのは難しいです。

Payackは、インターネットは従来の単語カウント方法論の最も差し迫った課題ではないと述べています。 彼の意見では、それは「グローバル英語」です。

英語には4億人近くのネイティブスピーカーがおり、世界で2番目に多いですが、全体で13 人のスピーカーがいるため、世界で最も広く理解されている言語になっています。 インドでは3億人以上が第二言語として話しており、少なくとも中国ではその多くの第二話者が話しています。

「今英語を話す人は誰でも英語を所有しているように感じます」とPayackは言います。 たとえば、形容詞「ブロークバック」を見てください。 アン・リー監督が恋に落ちた2人のカウボーイに関する映画を「ブロークバック・マウンテン」と呼んだ後、「ブロークバック」という言葉は「ゲイ」の同義語として英語の用語に広まりました。 「破産」はアメリカでの栄光の日々を過ぎているかもしれないが、この新しい意味を持つこの言葉は、中国でまだ人気があると、Payackは言った。 ブログやWebサイトに表示されます。つまり、勢いがあり、言葉であることを意味します。

「今日では、世界中のあらゆる方向に向かう人の往来がずっと多くなっています」と、地域の方言の発達を研究したシカゴ大学の言語学教授であるサリココ・ムフェンは語っています。 たとえば、中国語にヒントを得た言葉がアメリカ英語の一部になるかどうかは、「アメリカ人がアジア人と英語でどの程度定期的に交流するかにかかっている」と同氏は述べた。

もしそうなら、アメリカ人は平均してもっと冗長になるでしょうか? 平均的なアメリカ人は1日に約7, 500語を使用し、合計で約20, 000語を知っています。 シェークスピアでさえ、約6万人しか知りませんでした。

そのため、英語の単語の数は常に多く、誰もが知っているか使用しているよりも多くなります。

MufweneとAmerican HeritageのPickettの両方が、英語はすでに100万語を持っている可能性が非常に高いと語った。 単語を数えることは、結局のところ、不正確な科学です。

また、辞書の科学でもありません。 辞書の仕事は常に「人々の話し方を反映することであり、話し方を教えることではない」とムフフェンは言った。 辞書のリフレクションの幅が狭くなっても、依然として価値があります。

「辞書を編集して責任を持たせる必要があるので、信頼性が高い」とピケットは言った。 「そして、私はそれが変わるとは思わない。」

ミリオンワードマーチ