Welcome,{$name}!

/ Ausloggen
Deutsch
EnglishDeutschItaliaFrançais한국의русскийSvenskaNederlandespañolPortuguêspolskiSuomiGaeilgeSlovenskáSlovenijaČeštinaMelayuMagyarországHrvatskaDanskromânescIndonesiaΕλλάδαБългарски езикAfrikaansIsiXhosaisiZululietuviųMaoriKongeriketМонголулсO'zbekTiếng ViệtहिंदीاردوKurdîCatalàBosnaEuskera‎العربيةفارسیCorsaChicheŵaעִבְרִיתLatviešuHausaБеларусьአማርኛRepublika e ShqipërisëEesti Vabariikíslenskaမြန်မာМакедонскиLëtzebuergeschსაქართველოCambodiaPilipinoAzərbaycanພາສາລາວবাংলা ভাষারپښتوmalaɡasʲКыргыз тилиAyitiҚазақшаSamoaසිංහලภาษาไทยУкраїнаKiswahiliCрпскиGalegoनेपालीSesothoТоҷикӣTürk diliગુજરાતીಕನ್ನಡkannaḍaमराठी
Zuhause > Nachrichten > Join Nvidia: Mozilla veröffentlicht neue Version von Common Voice Dataset

Join Nvidia: Mozilla veröffentlicht neue Version von Common Voice Dataset

Common Voice ist ein Projekt, um Roboter wie eine reale Sprache zu unterrichten. Die Mozilla-Stiftung wurde vor einigen Jahren initiiert, die mit der neuesten Zusammenarbeit mit der Chip-Giganten Nvidia eingeleitet wurde. Es ist so konzipiert, dass Freiwillige zum weltweit größten offenen allgemeinen Sprachdatensatz beitragen, wodurch die Entwicklung der Sprachsynthese- und Identifikationstechnologie fördert wird.


Mit der Freigabe des neuen öffentlichen Sprachdatensatzes wird verstanden, dass der Common Voice Corpus mehr als 13.000 Stunden Vorbereitungsdaten aufweist.

Verglichen mit der vorherigen Version hat es 4622 Stunden Inhalte hinzugefügt und in der Unterstützung von 16 Sprachen eingeschaltet, darunter: Barceli, Slowakei, North Caldi, Bulgarisch, Kasachst, Bashkir, Galizi, Uiguren, Armenisch, Weißrussisch, Urdu, Guarani, Serbisch, Usbek, Aserbaidschan und Haisha.

Gegenwärtig hat Common Voice öffentliche Sprachdatenbanken von 76 Sprachen sowie mehr als 182.000 einzigartige Sounds gesammelt, die Mitwirkenden Gemeinden in den letzten sechs Monaten in 25% Wachstum eingeleiteten.


Die Rede beträgt 13905 Stunden, was mehr als 4622 Stunden von der vorherigen Version beträgt. Die ersten fünf Sprachen sind Englisch (2630 Stunden), Kiña Ruanda (2260 Stunden), Deutsch (1040 Stunden), Katalonien (920 Stunden) und die Weltsprache (840 Stunden).

Das höchste Wachstum ist Thai (ab 12 Stunden bis 250 Stunden, fast 20 Mal), LouGame-Sprache (9-mal 8 Stunden bis 80 Stunden), der Weltsprache (von 100 Stunden bis 840 Stunden, über 7 Mal), Tamil (von 24 Stunden bis 220 Stunden, ein Anstieg von 8 Mal).