2024年5月スタートの『6カ月で英単語・語法・英文法完全マスター』講座受講生を募集しています。希望者はここをクリック!

【英語よくある勘違い】dataは単数形か複数形か?

dataは単数にも複数にもなります。では、どのようにして使い分けられるのでしょうか? アカデミックな学術論文や政府の公式文書ではdataを複数形扱いにするのが今でも主流です。 ただし日常会話ではdataは単数形扱いの方が一般的です。

日本語の「データ」は英語のdataがそのまま訳されたものですが、dataを可算名詞(count noun)の単数形と思い込み、dataの複数形はdatasと勘違いする人がいます。例えば、学術文献を検索できるGoogle Scholarsで確認すると、datasという単語を使っている論文が多数見つかります。

Although many vertex datas between GPUs must be exchanged to run BFS on multi GPUs system…
「GPU-BOXにおける幅優先探索の高速化」(2014)


Thus, the vaporliquid equilibria datas in this study satisfy the requirement D-J<10.
「酢酸-水系の気液平衡に及ぼす塩効果」(2014)


In this study, we … propose a way to find parameters for calculating evaluation value by learning datas of actual novices ‘ move.
「将棋初心者の着手を予測するための評価関数の検討」(2015)


The extracted structures are qualitatively similar to the experimental datas.
「極超音速流における不安定モード成長の数値解析」(2016)


This time I produced the 3D datas with view to data preservation and utilization of cultural assets .
「Memento を用 い た 灯籠 の 3D 化」(2016)

もちろん、datasという単語は存在しません。data自体が複数形なので「データ」が複数ある場合は、

These data are summarized in Table 5.
これらのデータは表5に要約されている。

のように表現します。しかし、dataが単数形として扱われている文章もよく見かけます。

The data was collected by trained interviewers.
データは訓練されたインタビュアーによって集められた。

dataは単数にも複数にもなるということです。では、どのようにして使い分けられるのでしょうか?

目次

dataはなぜ複数形になるのか

単数形datumの複数形がdataです。どちらもラテン語からきた言葉です。datumという単語は1640年頃に英語に導入されます。ラテン語では「与件(something given)」という意味でしたが、今では「データ」(details, facts, and statistics collected for reference or analysis)という意味で使われています。dataは元々可算名詞の複数形でした。ラテン語を語源とする単語は複数形の語尾が-aになります。agenda, candelabra, criteria, media, phenomena, stamina, strataはそれぞれ元々agendum, candelabrum, criterion, medium, phenomenon, stamen, stratumの複数形です(注: agendaなどその多くは今は単数形として扱われています)。

昔ながらの語法に従うと、dataは常に複数形なので「1つのデータ」という表現をしたいときはdatumという単語を使わないといけません。

The individual datum is not conclusive, so more data are needed.
個々のデータでは結論付けられないのでもっとデータが必要である。

しかし、datumという単語はごく特殊な用法以外では死語となります(地図作製法、地理学、核磁気共鳴ではdatumが「測量基準点(any level surface, line, or point used as a reference in measuring elevations)」という意味で今でも使われていますが、その複数形はdataではなくdatumsです)。

単数形のdataがある秘密

しかしdataが単数形として使われることがあります。というか、複数形としてよりも、単数形として使われる方がはるかに多いです。dataが「抽象名詞(abstract noun)」として扱われているからです。抽象名詞は数えられないので複数形が存在せず、常に単数形の形を取ります。同じ抽象名詞のinformationをinformationsとは言わないのと同じことです。不可算名詞のdataはa body of factsもしくはinformationという意味になります。

Additional data is available from these websites.
追加データはこれらのウェブサイトから利用できる。

つまり、dataは単数形としても複数形としても使われます。そのため英語文献を読んでいると、data is…とdata are…という文章のどちらも見かけます。では、単数形と複数形のdataはどう使い分ければよいのでしょうか。

dataは単数と複数のどちらの方がポピュラーなのか?

アカデミックな学術論文や政府の公式文書ではdataを複数形扱いにするのが今でも主流です。つまりthe data are or the data showとなります。例えばthe Office for National Statistics(英国の国家統計局)のスタイルガイドラインには、dataをplural (複数)として使えとはっきり書かれています。

APA Styleのブログ(July 26, 2012)でTyler Krupaは複数扱いにすべき理由として、科学的な結果におけるデータは常に複数であることをあげています。

Keep in mind that most of the time the plural form data should be used. Scientific results are built upon testing things multiple times across multiple people, and we draw conclusions from the aggregate, not the individual, data points. Therefore, when referring to the collective results, be sure to use the plural form.

ほとんどの場合、複数の形のdataが使用されるべきであることを心に留めてください。科学的な結果は、複数の人を対象に何度もテストすることで得られ、個々のデータポイントではなく、全体のデータポイントから結論を導き出します。したがって、集合的な結果を参照するときは、必ず複数形を使用してください。

Royal Roads UniversityのWriting Centre CoordinatorのTheresa Bell (Jan. 30, 2014)やThoughtCo.のWhat Is the Plural of Data?という記事も問答無用でdataは複数形扱いだと主張しています。実は学術論文でもdataを単数扱いにする研究者が増えているのですが(例えば、The Chicago Manual of Styleは単数/複数併用を支持しています)、今でも頑なに「ラテン語ではdataは複数形だ。だから英語のdataも複数形にしないとだめだ。」と主張する人がいます。そういう人が査読論文のレフェリーにあたると、何かと面倒なので学術論文ではdataを複数扱いにする方が無難とは言えます。

ただし日常会話ではdataは単数形扱いの方が一般的です。つまり、The data indicates unemployment is still high. (そのデータは失業率が依然として高いことを示している。)と書いてまったく問題がありません。ただしニュアンスは変わります。Merriam-Webster’s Collegiate Dictionaryにはdataを複数扱いにするとstuffy (堅苦しい)、単数扱いにするとuneducated (無学の、教養のない)に聞こえると書かれています。それはつまり堅苦しくてよい論文やフォーマルな文書では複数形でかまわないということを意味します。これはhttp://www.lexically.net/TimJohns/Kibbitzer/revis006.htmでの調査でも明らかになっています。

PublicationFrequencyMarked plur/singPluralSingular
Nature1:563187 (23.6%)175 (93.6%)12 (6.4%)
New Scientist1:1,970123 (16.4%)84 (69.9%)39 (30.1%)
Guardian1:22,04781 (10.8%)32 (39.5%)49 (60.5%)

dataを複数/単数扱いのどちらで使われているか3誌で調べたところ、学術論文誌のNatureでは93.6%が複数扱いされているのに対し、よりインフォーマルな週刊誌のNew Scientistでは69.9%が複数扱い、そして日刊紙のGuardianでは比率が逆転して39.5%が複数扱い、60.5%が単数扱いになっています。ちなみにこの調査は約20年前に行われています。今では単数扱いの比率がもっと上がっているはずです。ためしにGoogle Ngram Viewerでdata isとdata areの使用数を調べたところ、1910年頃を境にdata isがdata areを追い越し、今は圧倒的にdata is優位の状況になっています。

新聞はアカデミックジャーナルよりもはフォーマルではありませんが、一般人からすると新聞は十分フォーマルな媒体と言えます。その新聞のほとんどがdataを単数/複数併用という立場をとっています。例えば、The Wall Street JournalはIs Data Is, or Is Data Ain’t, a Plural? (July 5, 2012)の記事で、dataを単数/複数併用で使うと宣言をします。The EconomistはData are? Revisited: The Wall Street Journal straddles the fence on this perennial usage debate (July 6, 2012)でThe Wall Street Journalの英断をレポートし、英国のThe Guardianもその数日後にData are or data is? (July 8, 2012)でさらに踏み込んで、dataを単数扱いにするのが正しいと発言します。The Guardianのスタイルガイドには

data
takes a singular verb (like agenda), though strictly a plural
厳密には複数形であるが、dataはagendaのように単数形動詞をとる

と説明されています。

dataを単数/複数扱いにする際の注意点

学術論文と公式文書では複数扱い、それ以外では単数扱いにするというのが一番無難な線です。ただしこのルールを準拠しなくても文法的には間違いにはなりません。日常会話でdataを複数扱いにしたら「堅苦しい」印象が生まれるだけです。きちっとすべきことは一貫性を保つことです。例えば、

What is this data? The data themselves reveal…

という文は文法的に間違いになります。どこが間違いかわかりますよね。

以下、dataを単数の不可算名詞扱いにする場合と、複数の可算名詞扱いする場合に注意すべき点をいくつか述べます。

manyとmuch、fewとlittle

dataを可算名詞扱いにすると、muchではなくmany、littleではなくfewを使わないといけません。不可算名詞扱いにすると逆になります。

【可算名詞扱いのdata】
Many data suggest that ants are drawn to chocolate.
多くのデータはアリがチョコレートに引き寄せられることを示唆している。
There are very few data in this field.
この分野にはデータがほとんどない。

【不可算名詞扱いのdata】
Much data suggests that ants are drawn to chocolate.
多くのデータはアリがチョコレートに引き寄せられることを示唆している。
There is very little data in this field.
この分野にはデータがほとんどない。

theseとthis

dataの前の指示代名詞がthisだとdataは単数扱い、指示代名詞がtheseだとdataは複数扱いにしないといけません。

This data is useless because of its lack of specifics.
このデータは具体性に欠けるので役に立たない。

Many of these data are useless because of their lack of specifics.
これらのデータの多くは具体性に欠けるので役に立たない。

可算名詞のdataを単数形にする場合

可算名詞のdataは単数形が事実上なく、基数で表記できません。だから単数形にする場合はa piece of dataと表記します。a data pointa set of dataと言ってもかまいませんが、a dataとは絶対言わないように注意して下さい。「2つのデータ」という時は、two dataではなく、two data setsもしくはtwo pieces of dataと言いましょう。

dataの代わりにinformation/factsを使え!

dataの用法にとまどったら、dataの代わりに不可算名詞の時はinformation (もしくはevidence)、可算名詞の複数形の時はfactsを使うという手があります。

This data is useless because of its lack of specifics. ➡ This information is useless because of its lack of specifics.
この情報は具体性に欠けるので役に立たない。

Many of these data are useless because of their lack of specifics. ➡ Many of these facts are useless because of their lack of specifics.
これらの事実の多くは具体性に欠けるので役に立たない。

多少語感が変わりますが、ほとんど意味に違いがありません。dataの語法に不安が出たら、この手が一番手っ取り早いです。

あわせて読みたい
大学受験英語対策講座─6カ月で英単語・語法・英文法完全マスター 『大学受験英語対策講座─6カ月で英単語・語法・英文法完全マスター』 大学合格に必要な英単語(5154語)、英熟語(1619語)、語法、英文法を6カ月で習得する講座です。暗記...

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次