Active filters: hi
Viewer
• Updated • 10.4B • 795k
• 586
Cognitive-Lab/NayanaOCR_Corpus_2025
Viewer
• Updated • 1.01M • 7.05k
• 13
Viewer
• Updated • 108k • 4.17k
• 70
Viewer
• Updated • 665k • 5.63k
• 30
Viewer
• Updated • 5.25M • 54
• 3
openlanguagedata/flores_plus
Viewer
• Updated • 883k • 17.1k
• 142
eaddario/imatrix-calibration
Viewer
• Updated • 299 • 36.5k
• 44
Helsinki-NLP/OpenSubtitles2024
Viewer
• Updated • 570M • 840
• 13
omarkamali/wikipedia-monthly
Viewer
• Updated • 195M • 11.7k
• 70
Viewer
• Updated • 55.1M • 30.4k
• 236
Updated • 54.3k
• 131
Updated • 2.28k
• 72
Viewer
• Updated • 434M • 262k
• 95
Viewer
• Updated • 1.5k • 165
• 10
ayymen/Pontoon-Translations
Viewer
• Updated • 3.56M • 1.7k
• 19
textdetox/multilingual_toxic_lexicon
Viewer
• Updated • 176k • 749
• 9
Updated • 1.09k
• 80
ernie-research/rendered_xnli
Updated • 21
• 2
Viewer
• Updated • 484k • 642
• 19
Viewer
• Updated • 893M • 17.7k
• 36
Viewer
• Updated • 4.5k • 2.87k
• 38
Viewer
• Updated • 9.03B • 52.8k
• 43
openfoodfacts/product-database
Viewer
• Updated • 4.57M • 8.1k
• 124
Viewer
• Updated • 11k • 741
• 27
Viewer
• Updated • 602k • 34.9k
• 159
CohereLabs/Global-MMLU-Lite
Viewer
• Updated • 13.4k • 8.47k
• 40
Viewer
• Updated • 59.1k • 479
• 13
AI-Culture-Commons/ai-culture-multilingual-json-dolma
Viewer
• Updated • 9.95k • 274
• 3
Viewer
• Updated • 2.45M • 29
• 2
Malikeh1375/code-switching-tokenizer-robustness
Viewer
• Updated • 1.2k • 447
• 2