英単語 英検2級 英検準1級
dataset
データセット/ˈdeɪtəset/名詞
意味
- 1データの集合、まとまったデータの一式分析や学習のために整理された一群のデータ。
例文
The researchers shared their dataset so others could check the results.
研究者たちは結果を他の人が検証できるようデータセットを公開した。
A larger dataset usually helps the model make better predictions.
より大きなデータセットはたいていモデルがよりよい予測をする助けになる。
よく使う形・コロケーション
- large dataset(大規模データセット)
- training dataset(訓練用データセット)
- public dataset(公開データセット)
類義語
data collectiondata set
ニュアンス・使い分け
dataset は data(データ)+ set(集合)からなる語で、「分析や機械学習のために集められたひとまとまりのデータ」を指す。data 自体は不可算名詞的に扱われ「情報そのもの」を意味するのに対し、dataset は「ひとつの単位としてまとめられたデータの集合体」を数えられる名詞として扱う点が違う。data set と二語で綴ることもある。機械学習では training dataset(訓練用)/ test dataset(検証用)の区別が重要で、近年のIT・統計分野で必須の語。
語源・由来
data(ラテン語 datum=与えられたもの、の複数形)+ set(集合)からなる20世紀の造語。