Shërbimet më të besuara të mbledhjes së të dhënave të të folurit për AI tuaj
Trajnoni modelet tuaja NLP, VA-të, prototipet TTS dhe më shumë me të dhëna cilësore bisedore, me shërbimet tona të mbledhjes së të dhënave audio dhe të të folurit
Zbuloni tubacionet e të dhënave audio pa pengesa
Klientë të veçuar
Shërbimet profesionale të mbledhjes së të dhënave audio/zë
Çdo subjekt. Çdo skenar.
Në Shaip, ekspertiza jonë qëndron në krijimin e grupeve të të dhënave të të folurit me cilësi të lartë të krijuar për kërkesa të ndryshme AI/ML. Ne ofrojmë një gamë të gjerë gjuhësh dhe regjistrojmë në mjedise të ndryshme duke i bërë grupet tona të të dhënave të plota dhe të adaptueshme. OFokusi ynë është në ushqyerjen e modeleve me volumin më të lartë të të dhënave të personalizuara të të folurit, në kohën më të vogël të mundshme. Me ne në bord, ju mund të prisni:
- Të dhëna audio/zanore shumëgjuhëshe të kuruara me cilësi të lartë për të përmirësuar saktësinë
- Niveli më i lartë i mundshëm i specifikës së domenit për target skenar të ndryshëm Setup
- Zmadhoni modelin tuaj ML për t'iu përshtatur demografisë dhe vertikaleve të ndryshme
- Mjediset e regjistrimit: Cilësia e studios, duke shfaqur audio të pastër kristal me zhurmë minimale të sfondit, dhe Mjediset Natyrore, ku regjistrimet përfshijnë tingujt e ambientit për të imituar situatat e botës reale.
100 +
55K +
Të dhënat e orëve të të folurit
250 +
projektet
60 +
Gjuhë (100+ dialekte)
8 / 16 / 44 / 48 kHz
Shkalla e mostrave
Ekspertiza jonë
Lidhni të dhënat audio për modele më inteligjente NLP
Shaip ofron shërbime të mbledhjes së të dhënave të të folurit/audio nga fundi në fund në mbi 100+ gjuhë për të mundësuar teknologjitë e aktivizuara me zë që të kujdesen për një grup të ndryshëm audiencash në të gjithë globin. Ne mund të punojmë në projekte të çdo shtrirjeje dhe madhësie; nga licencimi i grupeve ekzistuese të të dhënave audio jashtë raftit, te menaxhimi i mbledhjes së personalizuar të të dhënave audio, te transkriptimi audio dhe shënimi. Pavarësisht se sa i madh është projekti juaj i mbledhjes së të dhënave të të folurit, ne mund t'i personalizojmë shërbimet e mbledhjes së audios për t'iu përshtatur nevojave tuaja për të ndërtuar grupe të dhënash NLP me cilësi të lartë që synojnë dialektet, tonet dhe gjuhët. Zgjidhni nga gamën tonë të gjerë të grupeve të të dhënave të të folurit dhe burimeve të mbledhjes së të dhënave audio, për konfigurime inteligjente që mundësojnë zërin.
Fjalimi monolog i shkruar dhe spontan
Ai fokusohet në përpunimin e të folurit nga një folës i vetëm. Përdorni udhëzimet e skriptuara për të futur skedarë audio me një kanal, duke siguruar kapjen e modeleve unike të të folurit, toneve dhe nuancave specifike për atë individ.
Dialog i shkruar dhe fjalim spontan
Ndërveprim me dy persona, duke përsëritur biseda dhe dialogë në botën reale me ekspozim shumëgjuhësh përmes skedarëve me dy kanale dhe burimeve të transkriptuara.
Grupi / Muti-parti
bisedat
Diskutimet me shumë persona, kapja e dinamikës së grupit, mbivendosjet dhe tonet e ndryshme në mënyrë që të trajnohen me saktësi modelet e të folurit.
Fjalë zgjimi / Fraza kryesore / Koleksioni i fjalëve
Trajnoni AI-t për të identifikuar frazat kyçe ose për të zgjuar fjalët ose thëniet me kuptime të ngjashme duke përdorur thënie të ndryshme, të pasura dhe autentike për përpunimin dhe kuptimin e avancuar të gjuhës natyrore.
Të dhënat akustike
koleksion
Ne mund të regjistrojmë profesionalisht të dhëna audio me cilësi të studios, qofshin restorante, zyra, shtëpi ose nga mjedise dhe gjuhë të ndryshme, ndërkohë që mbulojmë një gamë më të gjerë akustike (Komplekse të të dhënave të tingullit gjithëpërfshirës).
Njohja automatike e të folurit (ASR)
Përmirësoni saktësinë e sistemeve tuaja të njohjes automatike të të folurit (ASR) duke pasur akses në grupe të dhënash të larmishme të të folurit/audio, nga një gamë e gjerë demografike.
Të dhëna shumëgjuhëshe të të folurit/trajnimit audio
Profesionistët tanë të aftë të gjuhës, në të gjithë globin ofrojnë të dhëna audio/të folura shumëgjuhëshe në gjuhë dhe dialekte të ndryshme. Kjo përpjekje nxit komunikimin global dhe kapërcen barrierat gjuhësore, duke kontribuar në zgjidhje më gjithëpërfshirëse dhe efektive të AI.
Tekst në Të folur
(TTS)
Ndërtoni një model shumëgjuhësh tekst në të folur (TTS) me ndihmën e fuqisë sonë punëtore globale, e cila ju ndihmon të mbledhni të dhëna të të folurit në 150+ gjuhë dhe dialekte për të përmirësuar modelet tuaja të AI nga kontrollet në makinë te chatbots dhe zgjidhjet e të mësuarit me të dhëna audio cilësore.
Call Center
bisedat
Shkëmbime të vërteta midis agjentëve dhe klientëve, duke mbështetur gjuhë të shumta si spanjisht, gjermanisht, anglisht amerikane, bengali, japonisht, kinezisht dhe hindisht.
Storie te Suksesshme
Grupet e të dhënave të AI biseduese me mbi 3 mijë orë të dhëna në 8 gjuhë
Duke kërkuar të ndërtojë një platformë shumëgjuhëshe për gjuhët indiane, klienti bashkëpunoi me Shaip për të mbledhur, segmentuar dhe transkriptuar grupe të dhënash të mëdha në shumë gjuhë indiane. Kjo do të ndihmonte në zhvillimin e modeleve efektive të të folurit që mund të fuqizojnë platformën e re inovative të klientit.
Problem: Mbi 3,000 orë të dhëna audio të mbledhura në 8 gjuhë indiane, të segmentuara dhe të transkriptuara për të zhvilluar njohjen automatike të të folurit.
Zgjidhja: Ne siguruam mbledhjen e të dhënave, segmentimin, transkriptimin dhe dorëzuam skedarët JSON me meta të dhëna. Ne mblodhëm 3000 orë të dhëna audio në 8 gjuhë indiane në shkallë për projektin e teknologjisë së të folurit të klientit.
Arsyet për të zgjedhur Shaip si partnerin tuaj të besueshëm për mbledhjen e të dhënave të të folurit
Njerëz
Ekipet e përkushtuara dhe të trajnuara:
- Mbi 30,000 bashkëpunëtorë për krijimin, etiketimin dhe sigurimin e të dhënave
- Ekipi i kredencializuar i menaxhimit të projektit
- Ekipi me përvojë i zhvillimit të produktit
- Ekipi i ndihmave të grupit të talenteve dhe i hyrjes në bord
Proces
Efikasiteti më i lartë i procesit sigurohet me:
- Procesi i fuqishëm 6 Sigma Stage-Gate
- Një ekip i dedikuar prej rripash të zinj 6 Sigma – Pronarët kryesorë të procesit dhe pajtueshmëria me cilësinë
- Përmirësimi i vazhdueshëm dhe cikli i komenteve
platformë
Platforma e patentuar ofron përfitime:
- Platformë e bazuar në ueb nga fundi në fund
- Cilësi e patëmetë
- TAT më i shpejtë
- Dorëzim pa ndërprerje
Njerëz
Ekipet e përkushtuara dhe të trajnuara:
- Mbi 30,000 bashkëpunëtorë për krijimin, etiketimin dhe sigurimin e të dhënave
- Ekipi i kredencializuar i menaxhimit të projektit
- Ekipi me përvojë i zhvillimit të produktit
- Ekipi i ndihmave të grupit të talenteve dhe i hyrjes në bord
Proces
Efikasiteti më i lartë i procesit sigurohet me:
- Procesi i fuqishëm 6 Sigma Stage-Gate
- Një ekip i dedikuar prej rripash të zinj 6 Sigma – Pronarët kryesorë të procesit dhe pajtueshmëria me cilësinë
- Përmirësimi i vazhdueshëm dhe cikli i komenteve
platformë
Platforma e patentuar ofron përfitime:
- Platformë e bazuar në ueb nga fundi në fund
- Cilësi e patëmetë
- TAT më i shpejtë
- Dorëzim pa ndërprerje
Grupet e të dhënave të të folurit jashtë raftit / audio
Detaje | ID-ja e korpusit (Unik) | Keyword | Grupi i të dhënave gjuhësore | Kodi i gjuhës | Norma e mostrës | Lloji i grupit të të dhënave | Orët totale të audios | Përshkrim i shkurtër | Përshkrimi i grupit të të dhënave | Kanali Audio | Platforma e regjistrimit | WER (%) | Format Audio | Formati i transkriptimit | Përdoreni rastin | Numri i folësve | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Nju Jork Anglisht_GC_8 | Anglisht Nju Jork | Anglisht Nju Jork | Vendndodhje | KHz 8 | Bisedë e Përgjithshme | 107 | Të dhënat e bisedës së përgjithshme angleze të Nju Jorkut | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 118, Mashkull 114, E panjohur 0 | Kontakt | |
Rusisht_SM_48 | rusisht | rusisht | ru-ru | KHz 48 | Monolog i shkruar | 2,398 | Monolog me shkrim rus | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1689 Mashkull 1937 E panjohur 214 | Kontakt | |
Punjabi_MA | punjabi | Punjabi (në linjë) | punjabi | Media Audio | 40 | Punjabi (In Pipeline) Të dhënat audio të medias | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Punjabi_GC | punjabi | Punjabi (në linjë) | punjabi | Bisedë e Përgjithshme | 100 | Të dhënat e bisedës së përgjithshme Punjabi (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Punjabi_CC_8 | punjabi | Punjabi (në linjë) | punjabi | Qendra e thirrjeve | 60 | Të dhënat e qendrës së thirrjeve Punjabi (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Polonia polake_SM_48 | Polonisht (Poloni) | Polonisht (Poloni) | pl-pl | KHz 48 | Monolog i shkruar | 1,482 | Polonia polake - Monolog i shkruar | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1324 Mashkull 701 E panjohur 24 | Kontakt | |
polonisht_MA_16 | polonisht | polonisht | pl_PL | KHz 16 | Media Audio | 269 | Audio i medias polake | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 173 Mashkull 354 E panjohur 6 | Kontakt | |
Oriya_MA | Oriya | Oriya (In Pipeline) | ose_IN | Media Audio | 40 | Oriya (In Pipeline) Të dhënat audio të medias | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Oriya_GC | Oriya | Oriya (In Pipeline) | ose_IN | Bisedë e Përgjithshme | 100 | Oriya (In Pipeline) Të dhënat e përgjithshme të bisedës | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Oriya_CC_8 | Oriya | Oriya (In Pipeline) | ose_IN | Qendra e thirrjeve | 60 | Të dhënat e qendrës së thirrjeve Oriya (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Zelanda e Re_MA_16 | Anglisht i Zelandës së Re | Anglisht i Zelandës së Re | en_NZ | KHz 16 | Media Audio | 400 | Audio i medias angleze të Zelandës së Re | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 367, mashkull 678, E panjohur 26 | Kontakt | |
Zelanda e Re_GC_8 | Anglisht i Zelandës së Re | Anglisht i Zelandës së Re | en_NZ | KHz 8 | Bisedë e Përgjithshme | 148 | Të dhënat e bisedës së përgjithshme angleze të Zelandës së Re | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 167, mashkull 121, E panjohur 4 | Kontakt | |
Nju Jork Anglisht_MA_16 | Anglisht Nju Jork | Anglisht Nju Jork | Vendndodhje | KHz 16 | Media Audio | 140 | Të dhënat audio të medias angleze të Nju Jorkut | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 66, Mashkull 230, E panjohur 11 | Kontakt | |
Skocez_GC_8 | skocez (theks anglisht) | skocez (theks anglisht) | en_AB | KHz 8 | Bisedë e Përgjithshme | 292 | Të dhënat e bisedës së përgjithshme skoceze | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 285, Mashkull 260, E panjohur 3 | Kontakt | |
Nju Jork Anglisht_CC_8 | Anglisht Nju Jork | Anglisht Nju Jork | Vendndodhje | KHz 8 | Qendra e thirrjeve | 103 | Të dhënat e qendrës së thirrjeve në anglisht të Nju Jorkut | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra 610, Mashkull 532, Nuk di 0 | Kontakt | |
Holandë_SM_48 | holandez | holandez | nl-NL | KHz 48 | Monolog i shkruar | 1,205 | Monolog me shkrim holandez | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1285 Mashkull 531 E panjohur 3 | Kontakt | |
Meksikan_SM_48 | Spanjisht (Meksikë) | Spanjisht (Meksikë) | en-MX | KHz 48 | Monolog i shkruar | 1,492 | Monolog me shkrim spanjoll meksikan | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1016 Mashkull 1069 E panjohur 95 | Kontakt | |
Marathi_MA | Marathi | Marathi (In Pipeline) | mr_IN | Media Audio | 40 | Marathi (In Pipeline) Të dhënat audio të medias | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Marathi_GC | Marathi | Marathi (In Pipeline) | mr_IN | Bisedë e Përgjithshme | 100 | Marathi (In Pipeline) Të dhënat e bisedës së përgjithshme | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Marathi_CC_8 | Marathi | Marathi (In Pipeline) | mr_IN | Qendra e thirrjeve | 60 | Të dhënat e Qendrës së Thirrjeve Marathi (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Malajalame_MA | Malayalam | malajalamisht (në linjë) | ml_IN | Media Audio | 40 | Të dhënat audio të medias malajalame (In Pipeline). | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Malajalame_GC | Malayalam | malajalamisht (në linjë) | ml_IN | Bisedë e Përgjithshme | 100 | Të dhënat e bisedës së përgjithshme malajalame (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Malajalame_CC_8 | Malayalam | malajalamisht (në linjë) | ml_IN | Qendra e thirrjeve | 60 | Të dhënat e qendrës së thirrjeve malajalame (në linjë). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Malay_MA_16 | malajas | malajas | ms_MY | KHz 16 | Media Audio | 344 | Të dhënat audio të medias Malay | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 236, Mashkull 626, E panjohur 47 | Kontakt | |
Malay_GC_8 | malajas | malajas | ms_MY | KHz 8 | Bisedë e Përgjithshme | 266 | Të dhënat e bisedës së përgjithshme malajze | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Sfera) - 15-60 minuta, Malay në Malajzi | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 316, Mashkull 176 , E panjohur 0 | Kontakt | |
Telugu_GC_8 | telugu | telugu | te_IN | KHz 8 | Bisedë e Përgjithshme | 553 | Të dhënat e bisedës së përgjithshme telugu | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 574, Mashkull 564, E panjohur 0 | Kontakt | |
Anglisht në Mbretërinë e Bashkuar_WW_16 | Anglisht në Mbretërinë e Bashkuar | Anglisht në Mbretërinë e Bashkuar | en_uk | KHz 16 | Fjala e zgjimit | 200 Folësit | Wake Word anglisht në MB | fraza kyçe mbledhja e të dhënave
| channel 1 | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Gjinia: 50% meshkuj, 50% femra, +/- 10%. | Kontakt | |
Uellsisht_GC_8 | Uellsisht (theks anglisht) | Uellsisht (theks anglisht) | en_WL | KHz 8 | Bisedë e Përgjithshme | 278 | Të dhënat e Bisedës së Përgjithshme të Uellsit | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 270, Mashkull 324, E panjohur 0 | Kontakt | |
Vietnamisht_MA_16 | vietnamisht | vietnamisht | vi_VN | KHz 16 | Media Audio | 257 | Të dhënat audio të medias vietnameze | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra 249, mashkull 200, Të panjohura 45 | Kontakt | |
Vietnamisht_GC_8 | vietnamisht | vietnamisht | vi_VN | KHz 8 | Bisedë e Përgjithshme | 295 | Të dhënat e Bisedës së Përgjithshme Vietnameze | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Sfera) 5-15 minuta, veriore (p.sh., Hanoi), qendrore dhe jugore (p.sh., qyteti Ho Chi Minh). | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra 400, mashkull 380, Të panjohura 2 | Kontakt | |
Turqi turke_SM_48 | Turqia turke | Turqia turke | tr-TR | KHz 48 | Monolog i shkruar | 2,027 | Turqia turke | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1561 Mashkull 1241 E panjohur 31 | Kontakt | |
Thai_MA_8 | Tajlandeze | Tajlandeze | th_TH | KHz 16 | Media Audio | 173 | Audio media tajlandeze | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 143, Mashkull 502, E panjohur 26 | Kontakt | |
Thai_GC_8 | Tajlandeze | Tajlandeze | th_TH | KHz 8 | Bisedë e Përgjithshme | 183 | Bisedë e Përgjithshme Thai | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, Një regjistër informal i përdorur midis miqve | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 338, Mashkull 96, E panjohur 8 | Kontakt | |
Telugu_MA | telugu | Telugu (In Pipeline) | te_IN | Media Audio | 20 | Telugu (In Pipeline) Të dhënat audio të medias | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Telugu_GC | telugu | Telugu (In Pipeline) | te_IN | Bisedë e Përgjithshme | 50 | Telugu (In Pipeline) Të dhënat e përgjithshme të bisedës | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Telugu_CC_8 | telugu | Telugu (In Pipeline) | te_IN | Qendra e thirrjeve | 30 | Telugu (In Pipeline) Të dhënat e qendrës së thirrjeve | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Telugu_MA_16 | telugu | telugu | te_IN | KHz 16 | Media Audio | 648 | Të dhënat audio të medias telugu | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 207, Mashkull 963, E panjohur 2 | Kontakt | |
Koreane_SM_48 | korean | korean | ko-KR | KHz 48 | Monolog i shkruar | 1,955 | Monolog me shkrim korean | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1195 Mashkull 1134 E panjohur 122 | Kontakt | |
Tamil_MA | tamil | Tamile (në linjë) | ta_IN | Media Audio | 40 | Të dhënat audio të medias Tamile (In Pipeline). | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Tamil_GC | tamil | Tamile (në linjë) | ta_IN | Bisedë e Përgjithshme | 100 | Të dhënat e bisedave të përgjithshme në Tamile (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Tamil_CC_8 | tamil | Tamile (në linjë) | ta_IN | Qendra e thirrjeve | 60 | Të dhënat e Qendrës së Thirrjeve Tamile (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Suedisht_MA_16 | suedez | suedez | sv_SE | KHz 16 | Media Audio | 278 | Të dhënat audio të medias suedeze | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 195, mashkull 500, E panjohur 21 | Kontakt | |
Suedisht_CC_8 | suedez | suedez | sv_SE | KHz 8 | Qendra e thirrjeve | 250 | Të dhënat e qendrës suedeze të thirrjeve | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1581, mashkull 727, E panjohur 2 | Kontakt | |
Suahili_MA_16 | swahili | swahili | sw_KE | KHz 16 | Media Audio | 265 | Të dhënat audio të medias suahili | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 118, Mashkull 493, E panjohur 25 | Kontakt | |
Suahili_CC_8 | swahili | swahili | sw_KE | KHz 8 | Qendra e thirrjeve | 230 | Të dhënat e Qendrës së Thirrjeve Suahili | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 611, Mashkull 833, E panjohur 0 | Kontakt | |
Anglisht e Afrikës së Jugut_MA_16 | Anglishtja e Afrikës së Jugut | Anglishtja e Afrikës së Jugut | en_ZA | KHz 16 | Media Audio | 251 | Të dhënat audio të medias angleze të Afrikës së Jugut | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 235, Mashkull 432, E panjohur 36 | Kontakt | |
Anglisht e Afrikës së Jugut_CC_8 | Anglishtja e Afrikës së Jugut | Anglishtja e Afrikës së Jugut | en_ZA | KHz 8 | Qendra e thirrjeve | 261 | Të dhënat e qendrës telefonike të Afrikës së Jugut | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1274 , Mashkull 935 , E panjohur 1 | Kontakt | |
Singapor_MA_16 | Anglisht Singapori | Anglisht Singapori | en_SG | KHz 16 | Media Audio | 247 | Të dhënat audio të medias në Singapor | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 160, Mashkull 455, E panjohur 37 | Kontakt | |
Singapor_CC_8 | Anglisht Singapori | Anglisht Singapori | en_SG | KHz 8 | Qendra e thirrjeve | 218 | Të dhënat e Qendrës së Thirrjeve të Singaporit | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 2139, Mashkull 884, E panjohur 21 | Kontakt | |
Boston_CC_8 | Boston anglisht | Boston anglisht | Vendndodhje | KHz 8 | Qendra e thirrjeve | 177 | Të dhënat e qendrës së thirrjeve në Boston | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 605, Mashkull: 711 dhe e panjohur: 0 | Kontakt | |
Anglisht Deep South_CC_8 | Anglisht Deep South | Anglisht Deep South | Vendndodhje | KHz 8 | Qendra e thirrjeve | 151 | Të dhënat e qendrës së thirrjeve në thellë jugore në anglisht | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 221 , Mashkull 1004 , E panjohur 7 | Kontakt | |
daneze_SM_48 | danez | danez | da-DK | KHz 48 | Monolog i shkruar | 2,579 | Monolog me shkrim danez | Regjistrimet me një thënie, të cilat priren të bien në intervalin 5 deri në 30 sekonda, daneze nga Danimarka | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1551 Mashkull 1233 E panjohur 42 | Kontakt | |
daneze_MA_16 | danez | danez | da_DK | KHz 16 | Media Audio | 664 | Të dhënat audio të medias daneze | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 369, Meshkuj: 864, E panjohur: 27 | Kontakt | |
daneze_GC_8 | danez | danez | da_DK | KHz 8 | Bisedë e Përgjithshme | 372 | Të dhënat e bisedës së përgjithshme daneze | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 311, Meshkuj: 417, E panjohur: 0 | Kontakt | |
Kineze tradicionale_SM_48 | Kineze Tradicionale | Kineze Tradicionale | zh-TW | KHz 48 | Monolog i shkruar | 1,028 | Kineze Tradicionale | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1069 Mashkull 262 E panjohur 3 | Kontakt | |
Kineze e thjeshtuar_SM_48 | Kineze e thjeshtuar | Kineze e thjeshtuar | zh-CN | KHz 48 | Monolog i shkruar | 2,762 | Kineze e thjeshtuar | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1920 Mashkull 1535 E panjohur 270 | Kontakt | |
Kinezisht_MA_16 | Anglisht Kinezisht | Anglisht Kinezisht | Vendndodhje | KHz 16 | Media Audio | 249 | Të dhënat audio të medias kineze | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 126, Mashkull: 346 dhe E panjohur: 6 | Kontakt | |
Kinezisht_CC_8 | Anglisht Kinezisht | Anglisht Kinezisht | Vendndodhje | KHz 8 | Qendra e thirrjeve | 169 | Të dhënat e qendrës së thirrjeve kineze | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 1790, Mashkull: 523 dhe E panjohur: 13 | Kontakt | |
Kanadeze_SM_48 | Frëngjisht Kanadeze | Frëngjisht Kanadeze | fr-CA | KHz 48 | Monolog i shkruar | 1,222 | Frëngjisht Kanadeze | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 974 Mashkull 631 E panjohur 1 | Kontakt | |
Boston_MA_16 | Boston anglisht | Boston anglisht | Vendndodhje | KHz 16 | Media Audio | 93 | Të dhënat audio të Boston Media | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 43, Mashkull: 181 dhe e panjohur: 2 | Kontakt | |
Boston_GC_8 | Boston anglisht | Boston anglisht | Vendndodhje | KHz 8 | Bisedë e Përgjithshme | 32 | Të dhënat e Bisedës së Përgjithshme të Bostonit | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 53, Mashkull: 83 dhe e panjohur: 0 | Kontakt | |
Anglisht Deep South_GC_8 | Anglisht Deep South | Anglisht Deep South | Vendndodhje | KHz 8 | Bisedë e Përgjithshme | 56 | Të dhënat e bisedës së përgjithshme në jug të thellë në anglisht | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 99, Mashkull 31, E panjohur 0 | Kontakt | |
Bengali_MA | Bengali | Bengalisht (In Pipeline) | bn_IN | Media Audio | 40 | Bengalisht (In Pipeline) Të dhënat audio të medias | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Bengali_GC | Bengali | Bengalisht (In Pipeline) | bn_IN | Bisedë e Përgjithshme | 100 | Të dhënat e bisedës së përgjithshme Bengali (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Bengali_CC_8 | Bengali | Bengalisht (In Pipeline) | bn_IN | Qendra e thirrjeve | 60 | Të dhënat e Qendrës së Thirrjeve Bengalisht (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Asamez_MA | Asamezisht | Asamez (në linjë) | si në | Media Audio | 40 | Të dhënat audio të medias asameze (In Pipeline). | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Asamese_GC | Asamezisht | Asamez (në linjë) | si në | Bisedë e Përgjithshme | 100 | Të dhënat e bisedës së përgjithshme asameze (në linjë). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Asamezisht_CC_8 | Asamezisht | Asamez (në linjë) | si në | Qendra e thirrjeve | 60 | Të dhënat e qendrës së thirrjeve asameze (në linjë). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Arabisht_SM_48 | Arab | Arab | ar-SA | KHz 48 | Monolog i shkruar | 1,947 | Monolog me shkrim arab | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 838 Mashkull 1209 E panjohur 78 | Kontakt | |
Arabisht_GC_8 | Arab | Arab | ar_AE | KHz 8 | Bisedë e Përgjithshme | 292 | Të dhënat e bisedës së përgjithshme arabe | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapja) - 15-60 minuta, arabisht nga vendet e Gjirit | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 171, Mashkull: 534 dhe e panjohur: 1 | Kontakt | |
Afrikans_MA_16 | afrikaans | afrikaans | af_ZA | KHz 16 | Media Audio | 658 | Skedarët e mediave afrikane | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 750, Mashkull: 1278 dhe e panjohur: 52 | Kontakt | |
afrikane_GC_8 | afrikaans | afrikaans | af_ZA | KHz 8 | Bisedë e Përgjithshme | 368 | Të dhënat e bisedës së përgjithshme afrikane | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Sfera) - 15-60 minuta, afrikanisht e folur në Afrikë | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 502, Mashkull: 390 dhe e panjohur: 2 | Kontakt | |
en_US_MA_16 | Gjuha popullore afrikano-amerikane | Gjuha popullore afrikano-amerikane | Vendndodhje | KHz 16 | Media Audio | 154 | Të dhënat e mediave vernakulare afrikano-amerikane | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 151, Mashkull: 150 dhe e panjohur: 10 | Kontakt | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | KHz 16 | Media Audio | 216 | HINGLISH Të dhënat audio të medias | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 75, Mashkull 380, E panjohur 0 | Kontakt | |
Koreane_MA_16 | korean | korean | ko_KR | KHz 16 | Media Audio | 204 | Të dhënat audio të medias koreane | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 70 Mashkull 303, E panjohur 25 | Kontakt | |
Koreane_CC_8 | korean | korean | ko_KR | KHz 8 | Qendra e thirrjeve | 107 | Të dhënat e qendrës së telefonatave koreane | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1086, Mashkull 210 , E panjohur 4 | Kontakt | |
Kannada_MA | kannada | Kanada (në linjë) | kn_IN | Media Audio | 40 | Kannada (In Pipeline) Të dhënat audio të medias | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Kannada_GC | kannada | Kanada (në linjë) | kn_IN | Bisedë e Përgjithshme | 100 | Kannada (In Pipeline) Të dhënat e bisedës së përgjithshme | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Kannada_CC_8 | kannada | Kanada (në linjë) | kn_IN | Qendra e thirrjeve | 60 | Të dhënat e qendrës së thirrjeve kanadeze (në linjë). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Japoneze_SM_48 | japonez | japonez | ja-JP | KHz 48 | Monolog i shkruar | 2,335 | Monolog me shkrim japonez | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1460 Mashkull 1221 E panjohur 194 | Kontakt | |
Irlandez_GC_8 | irlandez | irlandez | en_IE | KHz 8 | Bisedë e Përgjithshme | 192 | Të dhënat e bisedës së përgjithshme irlandeze | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 213 , Mashkull 153 , E panjohur 0 | Kontakt | |
Indonezisht_MA_16 | indonezian | indonezian | unë e bëra | KHz 16 | Media Audio | 643 | Të dhënat audio të medias indoneziane | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 746, Mashkull 1507, E panjohur 129 | Kontakt | |
Indonezisht_GC_8 | indonezian | indonezian | unë e bëra | KHz 8 | Bisedë e Përgjithshme | 496 | Të dhënat e bisedës së përgjithshme indoneziane | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Sfera) - 15-60 minuta, në gjuhën indoneziane | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 524, Mashkull 454, E panjohur 2 | Kontakt | |
hispanike_MA_16 | Anglisht hispanike | Anglisht hispanike | Vendndodhje | KHz 16 | Media Audio | 155 | Audio i thirrjeve hispanike të medias | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 140, Mashkull 219, E panjohur 5 | Kontakt | |
Hispanike_CC_8 | Anglisht hispanike | Anglisht hispanike | Vendndodhje | KHz 8 | Qendra e thirrjeve | 212 | Të dhënat e qendrës së thirrjeve hispanike | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 822, Mashkull 1262, E panjohur 0 | Kontakt | |
en_US_CC_8 | Gjuha popullore afrikano-amerikane | Gjuha popullore afrikano-amerikane | Vendndodhje | KHz 8 | Call-centre | 211 | Të dhënat e qendrës së thirrjeve popullore afrikano-amerikane | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femra: 612, Mashkull: 1242 dhe e panjohur: 12 | Kontakt | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | KHz 8 | Qendra e thirrjeve | 208 | HINGLISH Të dhënat e qendrës së thirrjeve | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 822, Mashkull 1262 , E panjohur 0 | Kontakt | |
Hindi_SM_48 | hindi | hindi | hi-IN | KHz 48 | Monolog i shkruar | 2,867 | Monolog me shkrim hindisht | Regjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekonda | Mono | Mobile App | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 1977 Mashkull 1864 E panjohur 147 | Kontakt | |
Hindi_MA_16 | hindi | hindi | hi_IN | KHz 16 | Media Audio | 219 | Të dhënat audio të medias Hindi | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 83, Mashkull 309, E panjohur 0 | Kontakt | |
Hebraisht_MA_16 | Hebraike | Hebraike | ai_IL | KHz 16 | Media Audio | 427 | Të dhënat audio të medias hebraike | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 361, Mashkull 513, E panjohur 13 | Kontakt | |
Hebraisht_Bisedë e Përgjithshme_8 | Hebraike | Hebraike | ai_IL | KHz 8 | Bisedë e Përgjithshme | 399 | Të dhënat e bisedës së përgjithshme hebraike | Bisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Sfera) - 15-60 minuta, hebraishtja në Izrael | Dual | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 414 , Mashkull 399 , E panjohur 1 | Kontakt | |
Gujarati_MA | gujarati | Guxharatisht (In Pipeline) | gu_IN | Media Audio | 40 | Guxharatisht (In Pipeline) Të dhënat audio të medias | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Guxharati_GC | gujarati | Guxharatisht (In Pipeline) | gu_IN | Bisedë e Përgjithshme | 100 | Guxharatisht (In Pipeline) Të dhënat e bisedës së përgjithshme | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
Guxharatisht_CC_8 | gujarati | Guxharatisht (In Pipeline) | gu_IN | Qendra e thirrjeve | 60 | Të dhënat e Qendrës së Thirrjeve në Gujarati (In Pipeline). | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Desktop | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Kontakt | ||||
gjermanisht_IVR_8 | gjermanisht | gjermanisht | de-De | KHz 8 | IVR | 200 | Të dhënat gjermane IVR | Njeriu në makinë. Një lloj fluksi IVR ku ka një kërkesë TTS (p.sh. "Si mund t'ju ndihmoj") e ndjekur nga një përgjigje spontane njerëzore | Mono | Desktop | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 10115 Mashkull 8750 E panjohur 0 | Kontakt | ||
gjermanisht_CC_8 | gjermanisht | gjermanisht | de-De | KHz 8 | Qendra e thirrjeve | 64 | Të dhënat e qendrës së thirrjeve gjermane | Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta, | Mono | Desktop | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 478 Mashkull 1440 E panjohur 0 | Kontakt | ||
Anglisht Deep South_MA_16 | Anglisht Deep South | Anglisht Deep South | Vendndodhje | KHz 16 | Media Audio | 266 | Të dhëna audio në gjuhën angleze Deep South Media | Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minuta | Mono | Ndihma në ueb | 5.0 | .vala | .json | ASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës | Femër 204, Mashkull 356, E panjohur 21 | Kontakt |
Shërbimet e ofruara
Mbledhja e të dhënave audio të ekspertëve nuk është e gjitha në dorë për konfigurime gjithëpërfshirëse të AI. Në Shaip, madje mund të merrni parasysh shërbimet e mëposhtme për t'i bërë modelet më të përhapura se zakonisht:
Mbledhja e të dhënave të tekstit
Sherbimet
Vlera e vërtetë e shërbimeve të mbledhjes së të dhënave njohëse Shaip është se u jep organizatave çelësin për të zhbllokuar informacionin kritik që gjendet brenda të dhënave të pastrukturuara
Shërbimet e mbledhjes së të dhënave të imazheve
Sigurohuni që modeli juaj i vizionit kompjuterik të identifikojë çdo imazh me saktësi, për të trajnuar pa probleme modelet e gjeneratës së ardhshme të AI të së ardhmes
Shërbimet e mbledhjes së të dhënave video
Tani përqendrohuni në vizionin kompjuterik së bashku me NLP për të trajnuar modelet tuaja për të identifikuar objektet, individët, parandaluesit dhe elementët e tjerë vizualë në përsosmëri
Burimet e rekomanduara
Ofrimi i
Shënim audio për AI inteligjente
Shërbimet e shënimeve audio kanë qenë një forte e Shaip që nga fillimi. Zhvilloni, trajnoni dhe përmirësoni inteligjencën artificiale bisedore, chatbots dhe motorët e njohjes së të folurit me shërbimet tona më të fundit të shënimeve audio.
Udhëzuesi i blerësit
Udhëzuesi i blerësit: Udhëzues i plotë për AI bashkëbiseduese
Chatbot me të cilin keni biseduar funksionon në një sistem të avancuar të AI biseduese që është trajnuar, testuar dhe ndërtuar duke përdorur mijëra grupe të dhënash për njohjen e të folurit.
Katalogu i të Dhënave
Katalogu dhe licencimi i të dhënave të të folurit jashtë raftit
Ka një shumëllojshmëri të gjerë aplikacionesh të zakonshme për të dhënat e të folurit në projektet e AI. Ne ju ofrojmë sasi të mëdha të dhënash me cilësi të lartë të gatshme për njohjen e zërit tuaj.
Dëshironi të ndërtoni të dhënat tuaja audio?
Lidhu me ekspertin tonë të brendshëm të mbledhjes së të dhënave të të folurit për të ngritur një depo audio që i përshtatet më mirë kërkesës suaj
Pyetjet e bëra më shpesh (FAQ)
Mbledhja e të dhënave të të folurit për një model ML i referohet procesit të mbledhjes së regjistrimeve audio të gjuhës së folur. Ky koleksion ndihmon në trajnimin dhe rafinimin e algoritmeve të mësimit të makinerive, veçanërisht ato të përqendruara në të kuptuarit dhe përpunimin e zërave njerëzorë.
Kur synoni të grumbulloni të dhëna audio për njohjen automatike të të folurit (ASR), duhet të filloni duke përcaktuar nevojat specifike të projektit tuaj, duke përfshirë gjuhën e dëshiruar, theksin dhe llojin e të folurit. Pas vendosjes së këtyre parametrave, sigurohuni që të merrni të gjitha lejet e nevojshme për të respektuar privatësinë e përdoruesit. Më pas, përdorni pajisje ose softuer të përshtatshëm regjistrimi për të kapur mostra të qarta audio. Çdo regjistrim duhet të shënohet në mënyrë të përpiktë me transkriptimin e tij ose meta të dhëna të tjera përkatëse dhe të ruhet sistematikisht për qasje të lehtë.
Një grup i të dhënave të të folurit në mësimin e makinës është thelbësor për trajnimin, testimin dhe vërtetimin e modeleve të përshtatura për të njohur, transkriptuar ose interpretuar gjuhën e folur. Të dhëna të tilla hapin rrugën për një mori aplikacionesh, nga asistentët e zërit dhe shërbimet e transkriptimit te biometria e zërit.
Për mbledhjen e të dhënave të sakta nga gjuhë dhe thekse të ndryshme, bashkëpunimi me folësit vendas të prejardhjes së dëshiruar gjuhësore është jetik. Synoni për një mostër të larmishme dhe përfaqësuese për të mbuluar një spektër të gjerë nuancash demografike. Përdorni pajisje regjistrimi të standardizuara në mjedise uniforme për të siguruar qëndrueshmëri audio. Dhe më e rëndësishmja, shënoni çdo pjesë të të dhënave me transkriptime dhe meta të dhëna të detajuara, duke treguar gjuhën dhe theksin specifik.