Shërbimet më të besuara të mbledhjes së të dhënave të të folurit për AI tuaj

Trajnoni modelet tuaja NLP, VA-të, prototipet TTS dhe më shumë me të dhëna cilësore bisedore, me shërbimet tona të mbledhjes së të dhënave audio dhe të të folurit

Mbledhja e të dhënave audio

Zbuloni tubacionet e të dhënave audio pa pengesa

Klientë të veçuar

Shërbimet profesionale të mbledhjes së të dhënave audio/zë

Çdo subjekt. Çdo skenar.

Në Shaip, ekspertiza jonë qëndron në krijimin e grupeve të të dhënave të të folurit me cilësi të lartë të krijuar për kërkesa të ndryshme AI/ML. Ne ofrojmë një gamë të gjerë gjuhësh dhe regjistrojmë në mjedise të ndryshme duke i bërë grupet tona të të dhënave të plota dhe të adaptueshme. OFokusi ynë është në ushqyerjen e modeleve me volumin më të lartë të të dhënave të personalizuara të të folurit, në kohën më të vogël të mundshme. Me ne në bord, ju mund të prisni: 

Mbledhja e të folurit
  • Të dhëna audio/zanore shumëgjuhëshe të kuruara me cilësi të lartë për të përmirësuar saktësinë
  • Niveli më i lartë i mundshëm i specifikës së domenit për target skenar të ndryshëm Setup
  •  Zmadhoni modelin tuaj ML për t'iu përshtatur demografisë dhe vertikaleve të ndryshme
  • Mjediset e regjistrimit: Cilësia e studios, duke shfaqur audio të pastër kristal me zhurmë minimale të sfondit, dhe Mjediset Natyrore, ku regjistrimet përfshijnë tingujt e ambientit për të imituar situatat e botës reale.

100 +

vendet

55K +

Të dhënat e orëve të të folurit

250 +

projektet

60 +

Gjuhë (100+ dialekte)

8 / 16 / 44 / 48 kHz

Shkalla e mostrave

Ekspertiza jonë

Lidhni të dhënat audio për modele më inteligjente NLP

Shaip ofron shërbime të mbledhjes së të dhënave të të folurit/audio nga fundi në fund në mbi 100+ gjuhë për të mundësuar teknologjitë e aktivizuara me zë që të kujdesen për një grup të ndryshëm audiencash në të gjithë globin. Ne mund të punojmë në projekte të çdo shtrirjeje dhe madhësie; nga licencimi i grupeve ekzistuese të të dhënave audio jashtë raftit, te menaxhimi i mbledhjes së personalizuar të të dhënave audio, te transkriptimi audio dhe shënimi. Pavarësisht se sa i madh është projekti juaj i mbledhjes së të dhënave të të folurit, ne mund t'i personalizojmë shërbimet e mbledhjes së audios për t'iu përshtatur nevojave tuaja për të ndërtuar grupe të dhënash NLP me cilësi të lartë që synojnë dialektet, tonet dhe gjuhët. Zgjidhni nga gamën tonë të gjerë të grupeve të të dhënave të të folurit dhe burimeve të mbledhjes së të dhënave audio, për konfigurime inteligjente që mundësojnë zërin.

Fjalimi monolog

Fjalimi monolog i shkruar dhe spontan

Ai fokusohet në përpunimin e të folurit nga një folës i vetëm. Përdorni udhëzimet e skriptuara për të futur skedarë audio me një kanal, duke siguruar kapjen e modeleve unike të të folurit, toneve dhe nuancave specifike për atë individ.

Fjalimi dialogues

Dialog i shkruar dhe fjalim spontan

Ndërveprim me dy persona, duke përsëritur biseda dhe dialogë në botën reale me ekspozim shumëgjuhësh përmes skedarëve me dy kanale dhe burimeve të transkriptuara.

Biseda shumëpalëshe

Grupi / Muti-parti
bisedat

Diskutimet me shumë persona, kapja e dinamikës së grupit, mbivendosjet dhe tonet e ndryshme në mënyrë që të trajnohen me saktësi modelet e të folurit.

Koleksioni i fjalëve zgjuese

Fjalë zgjimi / Fraza kryesore / Koleksioni i fjalëve

Trajnoni AI-t për të identifikuar frazat kyçe ose për të zgjuar fjalët ose thëniet me kuptime të ngjashme duke përdorur thënie të ndryshme, të pasura dhe autentike për përpunimin dhe kuptimin e avancuar të gjuhës natyrore.

Të folurit akustik

Të dhënat akustike
koleksion

Ne mund të regjistrojmë profesionalisht të dhëna audio me cilësi të studios, qofshin restorante, zyra, shtëpi ose nga mjedise dhe gjuhë të ndryshme, ndërkohë që mbulojmë një gamë më të gjerë akustike (Komplekse të të dhënave të tingullit gjithëpërfshirës).

Njohja automatike e të folurit

Njohja automatike e të folurit (ASR)

Përmirësoni saktësinë e sistemeve tuaja të njohjes automatike të të folurit (ASR) duke pasur akses në grupe të dhënash të larmishme të të folurit/audio, nga një gamë e gjerë demografike.

Të folurit e gjuhës natyrore

Të dhëna shumëgjuhëshe të të folurit/trajnimit audio

Profesionistët tanë të aftë të gjuhës, në të gjithë globin ofrojnë të dhëna audio/të folura shumëgjuhëshe në gjuhë dhe dialekte të ndryshme. Kjo përpjekje nxit komunikimin global dhe kapërcen barrierat gjuhësore, duke kontribuar në zgjidhje më gjithëpërfshirëse dhe efektive të AI.

Asistentë virtualë dixhitalë

Tekst në Të folur
(TTS)

Ndërtoni një model shumëgjuhësh tekst në të folur (TTS) me ndihmën e fuqisë sonë punëtore globale, e cila ju ndihmon të mbledhni të dhëna të të folurit në 150+ gjuhë dhe dialekte për të përmirësuar modelet tuaja të AI nga kontrollet në makinë te chatbots dhe zgjidhjet e të mësuarit me të dhëna audio cilësore.

Regjistrimet e qendrës së thirrjeve

Call Center
bisedat

Shkëmbime të vërteta midis agjentëve dhe klientëve, duke mbështetur gjuhë të shumta si spanjisht, gjermanisht, anglisht amerikane, bengali, japonisht, kinezisht dhe hindisht.

Storie te Suksesshme

Grupet e të dhënave të AI biseduese me mbi 3 mijë orë të dhëna në 8 gjuhë

Duke kërkuar të ndërtojë një platformë shumëgjuhëshe për gjuhët indiane, klienti bashkëpunoi me Shaip për të mbledhur, segmentuar dhe transkriptuar grupe të dhënash të mëdha në shumë gjuhë indiane. Kjo do të ndihmonte në zhvillimin e modeleve efektive të të folurit që mund të fuqizojnë platformën e re inovative të klientit.

Problem: Mbi 3,000 orë të dhëna audio të mbledhura në 8 gjuhë indiane, të segmentuara dhe të transkriptuara për të zhvilluar njohjen automatike të të folurit.

Zgjidhja: Ne siguruam mbledhjen e të dhënave, segmentimin, transkriptimin dhe dorëzuam skedarët JSON me meta të dhëna. Ne mblodhëm 3000 orë të dhëna audio në 8 gjuhë indiane në shkallë për projektin e teknologjisë së të folurit të klientit.

Studim rasti për mbledhjen e të dhënave të të folurit

Arsyet për të zgjedhur Shaip si partnerin tuaj të besueshëm për mbledhjen e të dhënave të të folurit

Njerëz

Njerëz

Ekipet e përkushtuara dhe të trajnuara:

  • Mbi 30,000 bashkëpunëtorë për krijimin, etiketimin dhe sigurimin e të dhënave
  • Ekipi i kredencializuar i menaxhimit të projektit
  • Ekipi me përvojë i zhvillimit të produktit
  • Ekipi i ndihmave të grupit të talenteve dhe i hyrjes në bord
Proces

Proces

Efikasiteti më i lartë i procesit sigurohet me:

  • Procesi i fuqishëm 6 Sigma Stage-Gate
  • Një ekip i dedikuar prej rripash të zinj 6 Sigma – Pronarët kryesorë të procesit dhe pajtueshmëria me cilësinë
  • Përmirësimi i vazhdueshëm dhe cikli i komenteve
platformë

platformë

Platforma e patentuar ofron përfitime:

  • Platformë e bazuar në ueb nga fundi në fund
  • Cilësi e patëmetë
  • TAT më i shpejtë
  • Dorëzim pa ndërprerje

Grupet e të dhënave të të folurit jashtë raftit / audio

DetajeGrupi i të dhënave gjuhësoreNorma e mostrësLloji i grupit të të dhënaveOrët totale të audiosPërshkrim i shkurtërPërshkrimi i grupit të të dhënaveKanali AudioPlatforma e regjistrimitWER (%)Format AudioFormati i transkriptimitPërdoreni rastinNumri i folësveCTA
FjalimNju Jork Anglisht_GC_8Anglisht Nju JorkAnglisht Nju JorkVendndodhjeKHz 8Bisedë e Përgjithshme107Të dhënat e bisedës së përgjithshme angleze të Nju JorkutBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 118, Mashkull 114, E panjohur 0
FjalimRusisht_SM_48rusishtrusishtru-ruKHz 48Monolog i shkruar2,398Monolog me shkrim rusRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1689 Mashkull 1937 E panjohur 214
FjalimPunjabi_MApunjabiPunjabi (në linjë) punjabi Media Audio40Punjabi (In Pipeline) Të dhënat audio të mediasSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimPunjabi_GCpunjabiPunjabi (në linjë) punjabiBisedë e Përgjithshme100Të dhënat e bisedës së përgjithshme Punjabi (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimPunjabi_CC_8punjabiPunjabi (në linjë) punjabiQendra e thirrjeve60Të dhënat e qendrës së thirrjeve Punjabi (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimPolonia polake_SM_48Polonisht (Poloni)Polonisht (Poloni)pl-plKHz 48Monolog i shkruar1,482Polonia polake - Monolog i shkruarRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1324 Mashkull 701 E panjohur 24
Fjalimpolonisht_MA_16polonishtpolonishtpl_PLKHz 16Media Audio269Audio i medias polakeSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 173 Mashkull 354 E panjohur 6
FjalimOriya_MAOriyaOriya (In Pipeline) ose_INMedia Audio40Oriya (In Pipeline) Të dhënat audio të mediasSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimOriya_GCOriyaOriya (In Pipeline) ose_INBisedë e Përgjithshme100Oriya (In Pipeline) Të dhënat e përgjithshme të bisedësBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimOriya_CC_8OriyaOriya (In Pipeline) ose_INQendra e thirrjeve60Të dhënat e qendrës së thirrjeve Oriya (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimZelanda e Re_MA_16Anglisht i Zelandës së Re Anglisht i Zelandës së Re en_NZKHz 16Media Audio400Audio i medias angleze të Zelandës së ReSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 367, mashkull 678, E panjohur 26
FjalimZelanda e Re_GC_8Anglisht i Zelandës së Re Anglisht i Zelandës së Re en_NZKHz 8Bisedë e Përgjithshme148Të dhënat e bisedës së përgjithshme angleze të Zelandës së ReBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 167, mashkull 121, E panjohur 4
FjalimNju Jork Anglisht_MA_16Anglisht Nju JorkAnglisht Nju JorkVendndodhjeKHz 16Media Audio140Të dhënat audio të medias angleze të Nju JorkutSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 66, Mashkull 230, E panjohur 11
FjalimSkocez_GC_8skocez (theks anglisht)skocez (theks anglisht)en_ABKHz 8Bisedë e Përgjithshme292Të dhënat e bisedës së përgjithshme skocezeBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 285, Mashkull 260, E panjohur 3
FjalimNju Jork Anglisht_CC_8Anglisht Nju JorkAnglisht Nju JorkVendndodhjeKHz 8Qendra e thirrjeve103Të dhënat e qendrës së thirrjeve në anglisht të Nju JorkutBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra 610, Mashkull 532, Nuk di 0
FjalimHolandë_SM_48holandezholandeznl-NLKHz 48Monolog i shkruar1,205Monolog me shkrim holandezRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1285 Mashkull 531 E panjohur 3
FjalimMeksikan_SM_48Spanjisht (Meksikë)Spanjisht (Meksikë)en-MXKHz 48Monolog i shkruar1,492Monolog me shkrim spanjoll meksikanRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1016 Mashkull 1069 E panjohur 95
FjalimMarathi_MAMarathiMarathi (In Pipeline) mr_INMedia Audio40Marathi (In Pipeline) Të dhënat audio të mediasSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimMarathi_GCMarathiMarathi (In Pipeline) mr_INBisedë e Përgjithshme100Marathi (In Pipeline) Të dhënat e bisedës së përgjithshmeBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimMarathi_CC_8MarathiMarathi (In Pipeline) mr_INQendra e thirrjeve60Të dhënat e Qendrës së Thirrjeve Marathi (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimMalajalame_MAMalayalammalajalamisht (në linjë) ml_INMedia Audio40Të dhënat audio të medias malajalame (In Pipeline).Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimMalajalame_GCMalayalammalajalamisht (në linjë) ml_INBisedë e Përgjithshme100Të dhënat e bisedës së përgjithshme malajalame (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimMalajalame_CC_8Malayalammalajalamisht (në linjë) ml_INQendra e thirrjeve60Të dhënat e qendrës së thirrjeve malajalame (në linjë).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimMalay_MA_16malajasmalajasms_MYKHz 16Media Audio344Të dhënat audio të medias MalaySkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 236, Mashkull 626, E panjohur 47
FjalimMalay_GC_8malajasmalajasms_MYKHz 8Bisedë e Përgjithshme266Të dhënat e bisedës së përgjithshme malajzeBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Sfera) - 15-60 minuta, Malay në MalajziDualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 316, Mashkull 176 , E panjohur 0
FjalimTelugu_GC_8telugutelugute_INKHz 8Bisedë e Përgjithshme553Të dhënat e bisedës së përgjithshme teluguBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 574, Mashkull 564, E panjohur 0
FjalimAnglisht në Mbretërinë e Bashkuar_WW_16Anglisht në Mbretërinë e BashkuarAnglisht në Mbretërinë e Bashkuaren_ukKHz 16Fjala e zgjimit200 FolësitWake Word anglisht në MBfraza kyçe mbledhja e të dhënave
  • folësit 200
  • 4 fraza kyçe unike për folës
  • 25-30 regjistrime të përsëritura të frazave kyçe për frazë unike kryesore
  • 25-30 skedarë audio për frazë unike kryesore
  • Gjithsej 120 fjali të regjistruara për folës
channel 1Mobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësGjinia: 50% meshkuj, 50% femra, +/- 10%.
FjalimUellsisht_GC_8Uellsisht (theks anglisht)Uellsisht (theks anglisht)en_WLKHz 8Bisedë e Përgjithshme278Të dhënat e Bisedës së Përgjithshme të UellsitBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 270, Mashkull 324, E panjohur 0
FjalimVietnamisht_MA_16vietnamishtvietnamishtvi_VNKHz 16Media Audio257Të dhënat audio të medias vietnamezeSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra 249, mashkull 200, Të panjohura 45
FjalimVietnamisht_GC_8vietnamishtvietnamishtvi_VNKHz 8Bisedë e Përgjithshme295Të dhënat e Bisedës së Përgjithshme VietnamezeBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Sfera) 5-15 minuta, veriore (p.sh., Hanoi), qendrore dhe jugore (p.sh., qyteti Ho Chi Minh).DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra 400, mashkull 380, Të panjohura 2
FjalimTurqi turke_SM_48Turqia turkeTurqia turketr-TRKHz 48Monolog i shkruar2,027Turqia turkeRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1561 Mashkull 1241 E panjohur 31
FjalimThai_MA_8TajlandezeTajlandezeth_THKHz 16Media Audio173Audio media tajlandezeSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 143, Mashkull 502, E panjohur 26
FjalimThai_GC_8TajlandezeTajlandezeth_THKHz 8Bisedë e Përgjithshme183Bisedë e Përgjithshme ThaiBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, Një regjistër informal i përdorur midis miqveDualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 338, Mashkull 96, E panjohur 8
FjalimTelugu_MAteluguTelugu (In Pipeline) te_INMedia Audio20Telugu (In Pipeline) Të dhënat audio të mediasSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimTelugu_GCteluguTelugu (In Pipeline) te_INBisedë e Përgjithshme50Telugu (In Pipeline) Të dhënat e përgjithshme të bisedësBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimTelugu_CC_8teluguTelugu (In Pipeline) te_INQendra e thirrjeve30Telugu (In Pipeline) Të dhënat e qendrës së thirrjeveBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimTelugu_MA_16telugutelugute_INKHz 16Media Audio648Të dhënat audio të medias teluguSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 207, Mashkull 963, E panjohur 2
FjalimKoreane_SM_48koreankoreanko-KRKHz 48Monolog i shkruar1,955Monolog me shkrim koreanRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1195 Mashkull 1134 E panjohur 122
FjalimTamil_MAtamil Tamile (në linjë) ta_INMedia Audio40Të dhënat audio të medias Tamile (In Pipeline).Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimTamil_GCtamilTamile (në linjë) ta_INBisedë e Përgjithshme100Të dhënat e bisedave të përgjithshme në Tamile (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimTamil_CC_8tamilTamile (në linjë) ta_INQendra e thirrjeve60Të dhënat e Qendrës së Thirrjeve Tamile (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimSuedisht_MA_16suedezsuedezsv_SEKHz 16Media Audio278Të dhënat audio të medias suedezeSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 195, mashkull 500, E panjohur 21
FjalimSuedisht_CC_8suedezsuedezsv_SEKHz 8Qendra e thirrjeve250Të dhënat e qendrës suedeze të thirrjeveBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1581, mashkull 727, E panjohur 2
FjalimSuahili_MA_16swahiliswahilisw_KEKHz 16Media Audio265Të dhënat audio të medias suahiliSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 118, Mashkull 493, E panjohur 25
FjalimSuahili_CC_8swahiliswahilisw_KEKHz 8Qendra e thirrjeve230Të dhënat e Qendrës së Thirrjeve SuahiliBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 611, Mashkull 833, E panjohur 0
FjalimAnglisht e Afrikës së Jugut_MA_16Anglishtja e Afrikës së JugutAnglishtja e Afrikës së Juguten_ZAKHz 16Media Audio251Të dhënat audio të medias angleze të Afrikës së JugutSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 235, Mashkull 432, E panjohur 36
FjalimAnglisht e Afrikës së Jugut_CC_8Anglishtja e Afrikës së JugutAnglishtja e Afrikës së Juguten_ZAKHz 8Qendra e thirrjeve261Të dhënat e qendrës telefonike të Afrikës së JugutBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1274 , Mashkull 935 , E panjohur 1
FjalimSingapor_MA_16Anglisht SingaporiAnglisht Singaporien_SGKHz 16Media Audio247Të dhënat audio të medias në SingaporSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 160, Mashkull 455, E panjohur 37
FjalimSingapor_CC_8Anglisht SingaporiAnglisht Singaporien_SGKHz 8Qendra e thirrjeve218Të dhënat e Qendrës së Thirrjeve të SingaporitBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 2139, Mashkull 884, E panjohur 21
FjalimBoston_CC_8Boston anglishtBoston anglishtVendndodhjeKHz 8Qendra e thirrjeve177Të dhënat e qendrës së thirrjeve në BostonBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 605, Mashkull: 711 dhe e panjohur: 0
FjalimAnglisht Deep South_CC_8Anglisht Deep SouthAnglisht Deep SouthVendndodhjeKHz 8Qendra e thirrjeve151Të dhënat e qendrës së thirrjeve në thellë jugore në anglishtBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 221 , Mashkull 1004 , E panjohur 7
Fjalimdaneze_SM_48danezdanezda-DKKHz 48Monolog i shkruar2,579Monolog me shkrim danezRegjistrimet me një thënie, të cilat priren të bien në intervalin 5 deri në 30 sekonda, daneze nga DanimarkaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1551 Mashkull 1233 E panjohur 42
Fjalimdaneze_MA_16danezdanezda_DKKHz 16Media Audio664Të dhënat audio të medias danezeSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 369, Meshkuj: 864, E panjohur: 27
Fjalimdaneze_GC_8danezdanezda_DKKHz 8Bisedë e Përgjithshme372Të dhënat e bisedës së përgjithshme danezeBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 311, Meshkuj: 417, E panjohur: 0
FjalimKineze tradicionale_SM_48Kineze TradicionaleKineze Tradicionalezh-TWKHz 48Monolog i shkruar1,028Kineze TradicionaleRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1069 Mashkull 262 E panjohur 3
FjalimKineze e thjeshtuar_SM_48Kineze e thjeshtuarKineze e thjeshtuarzh-CNKHz 48Monolog i shkruar2,762Kineze e thjeshtuarRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1920 Mashkull 1535 E panjohur 270
FjalimKinezisht_MA_16Anglisht KinezishtAnglisht KinezishtVendndodhjeKHz 16Media Audio249Të dhënat audio të medias kinezeSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 126, Mashkull: 346 dhe E panjohur: 6
FjalimKinezisht_CC_8Anglisht KinezishtAnglisht KinezishtVendndodhjeKHz 8Qendra e thirrjeve169Të dhënat e qendrës së thirrjeve kinezeBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 1790, Mashkull: 523 dhe E panjohur: 13
FjalimKanadeze_SM_48Frëngjisht KanadezeFrëngjisht Kanadezefr-CAKHz 48Monolog i shkruar1,222Frëngjisht KanadezeRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 974 Mashkull 631 E panjohur 1
FjalimBoston_MA_16Boston anglishtBoston anglishtVendndodhjeKHz 16Media Audio93Të dhënat audio të Boston MediaSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 43, Mashkull: 181 dhe e panjohur: 2
FjalimBoston_GC_8Boston anglishtBoston anglishtVendndodhjeKHz 8Bisedë e Përgjithshme32Të dhënat e Bisedës së Përgjithshme të BostonitBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 53, Mashkull: 83 dhe e panjohur: 0
FjalimAnglisht Deep South_GC_8Anglisht Deep SouthAnglisht Deep SouthVendndodhjeKHz 8Bisedë e Përgjithshme56Të dhënat e bisedës së përgjithshme në jug të thellë në anglishtBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 99, Mashkull 31, E panjohur 0
FjalimBengali_MABengaliBengalisht (In Pipeline) bn_INMedia Audio40Bengalisht (In Pipeline) Të dhënat audio të mediasSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimBengali_GCBengaliBengalisht (In Pipeline) bn_INBisedë e Përgjithshme100Të dhënat e bisedës së përgjithshme Bengali (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimBengali_CC_8BengaliBengalisht (In Pipeline) bn_INQendra e thirrjeve60Të dhënat e Qendrës së Thirrjeve Bengalisht (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimAsamez_MAAsamezishtAsamez (në linjë) si nëMedia Audio40Të dhënat audio të medias asameze (In Pipeline).Skedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimAsamese_GCAsamezishtAsamez (në linjë) si nëBisedë e Përgjithshme100Të dhënat e bisedës së përgjithshme asameze (në linjë).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimAsamezisht_CC_8AsamezishtAsamez (në linjë) si nëQendra e thirrjeve60Të dhënat e qendrës së thirrjeve asameze (në linjë).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimArabisht_SM_48ArabArabar-SAKHz 48Monolog i shkruar1,947Monolog me shkrim arabRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 838 Mashkull 1209 E panjohur 78
FjalimArabisht_GC_8ArabArabar_AEKHz 8Bisedë e Përgjithshme292Të dhënat e bisedës së përgjithshme arabeBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapja) - 15-60 minuta, arabisht nga vendet e GjiritDualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 171, Mashkull: 534 dhe e panjohur: 1
FjalimAfrikans_MA_16afrikaansafrikaansaf_ZAKHz 16Media Audio658Skedarët e mediave afrikaneSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 750, Mashkull: 1278 dhe e panjohur: 52
Fjalimafrikane_GC_8afrikaansafrikaansaf_ZAKHz 8Bisedë e Përgjithshme368Të dhënat e bisedës së përgjithshme afrikaneBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Sfera) - 15-60 minuta, afrikanisht e folur në AfrikëDualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 502, Mashkull: 390 dhe e panjohur: 2
Fjalimen_US_MA_16Gjuha popullore afrikano-amerikaneGjuha popullore afrikano-amerikaneVendndodhjeKHz 16Media Audio154Të dhënat e mediave vernakulare afrikano-amerikaneSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 151, Mashkull: 150 dhe e panjohur: 10
FjalimHINGLISH_MA_16HinglishHinglishhg_INKHz 16Media Audio216HINGLISH Të dhënat audio të mediasSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 75, Mashkull 380, E panjohur 0
FjalimKoreane_MA_16koreankoreanko_KRKHz 16Media Audio204Të dhënat audio të medias koreaneSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 70 Mashkull 303, E panjohur 25
FjalimKoreane_CC_8koreankoreanko_KRKHz 8Qendra e thirrjeve107Të dhënat e qendrës së telefonatave koreaneBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1086, Mashkull 210 , E panjohur 4
FjalimKannada_MAkannadaKanada (në linjë) kn_INMedia Audio40Kannada (In Pipeline) Të dhënat audio të mediasSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimKannada_GCkannadaKanada (në linjë) kn_INBisedë e Përgjithshme100Kannada (In Pipeline) Të dhënat e bisedës së përgjithshmeBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimKannada_CC_8kannadaKanada (në linjë) kn_INQendra e thirrjeve60Të dhënat e qendrës së thirrjeve kanadeze (në linjë).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimJaponeze_SM_48japonezjaponezja-JPKHz 48Monolog i shkruar2,335Monolog me shkrim japonezRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1460 Mashkull 1221 E panjohur 194
FjalimIrlandez_GC_8irlandezirlandezen_IEKHz 8Bisedë e Përgjithshme192Të dhënat e bisedës së përgjithshme irlandezeBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Rapsi) - 15-60 minuta, DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 213 , Mashkull 153 , E panjohur 0
FjalimIndonezisht_MA_16indonezianindonezianunë e bëraKHz 16Media Audio643Të dhënat audio të medias indonezianeSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 746, Mashkull 1507, E panjohur 129
FjalimIndonezisht_GC_8indonezianindonezianunë e bëraKHz 8Bisedë e Përgjithshme496Të dhënat e bisedës së përgjithshme indonezianeBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Sfera) - 15-60 minuta, në gjuhën indonezianeDualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 524, Mashkull 454, E panjohur 2
Fjalimhispanike_MA_16Anglisht hispanikeAnglisht hispanikeVendndodhjeKHz 16Media Audio155Audio i thirrjeve hispanike të mediasSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 140, Mashkull 219, E panjohur 5
FjalimHispanike_CC_8Anglisht hispanikeAnglisht hispanikeVendndodhjeKHz 8Qendra e thirrjeve212Të dhënat e qendrës së thirrjeve hispanikeBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 822, Mashkull 1262, E panjohur 0
Fjalimen_US_CC_8Gjuha popullore afrikano-amerikaneGjuha popullore afrikano-amerikaneVendndodhjeKHz 8Call-centre211Të dhënat e qendrës së thirrjeve popullore afrikano-amerikaneBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemra: 612, Mashkull: 1242 dhe e panjohur: 12
FjalimHINGLISH_CC_8HinglishHinglishhg_INKHz 8Qendra e thirrjeve208HINGLISH Të dhënat e qendrës së thirrjeveBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,DualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 822, Mashkull 1262 , E panjohur 0
FjalimHindi_SM_48hindihindihi-INKHz 48Monolog i shkruar2,867Monolog me shkrim hindishtRegjistrimet me një shprehje, të cilat priren të bien në intervalin 5 deri në 30 sekondaMonoMobile App5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 1977 Mashkull 1864 E panjohur 147
FjalimHindi_MA_16hindihindihi_INKHz 16Media Audio219Të dhënat audio të medias HindiSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 83, Mashkull 309, E panjohur 0
FjalimHebraisht_MA_16HebraikeHebraikeai_ILKHz 16Media Audio427Të dhënat audio të medias hebraikeSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 361, Mashkull 513, E panjohur 13
FjalimHebraisht_Bisedë e Përgjithshme_8HebraikeHebraikeai_ILKHz 8Bisedë e Përgjithshme399Të dhënat e bisedës së përgjithshme hebraikeBisedë telefonike e pascript mes dy personave. Përafërsisht. Kohëzgjatja e audios (Sfera) - 15-60 minuta, hebraishtja në IzraelDualDesktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 414 , Mashkull 399 , E panjohur 1
FjalimGujarati_MAgujaratiGuxharatisht (In Pipeline) gu_INMedia Audio40Guxharatisht (In Pipeline) Të dhënat audio të mediasSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimGuxharati_GCgujaratiGuxharatisht (In Pipeline) gu_INBisedë e Përgjithshme100Guxharatisht (In Pipeline) Të dhënat e bisedës së përgjithshmeBisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
FjalimGuxharatisht_CC_8gujaratiGuxharatisht (In Pipeline) gu_INQendra e thirrjeve60Të dhënat e Qendrës së Thirrjeve në Gujarati (In Pipeline).Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,Desktop5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës
Fjalimgjermanisht_IVR_8gjermanishtgjermanishtde-DeKHz 8 IVR200Të dhënat gjermane IVRNjeriu në makinë. Një lloj fluksi IVR ku ka një kërkesë TTS (p.sh. "Si mund t'ju ndihmoj") e ndjekur nga një përgjigje spontane njerëzoreMonoDesktop.vala .jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhës Femër 10115 Mashkull 8750 E panjohur 0
Fjalimgjermanisht_CC_8gjermanishtgjermanishtde-DeKHz 8Qendra e thirrjeve64Të dhënat e qendrës së thirrjeve gjermane Bisedë telefonike sintetike e pascript midis "agjentit" dhe "klientit", Përafërsisht. Kohëzgjatja e audios (Fapa) 5-15 minuta,MonoDesktop.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 478 Mashkull 1440 E panjohur 0
FjalimAnglisht Deep South_MA_16Anglisht Deep SouthAnglisht Deep SouthVendndodhjeKHz 16Media Audio266Të dhëna audio në gjuhën angleze Deep South MediaSkedarët audio/video të domenit publik të licensuar si intervista, podkaste etj - 1 deri në 5 persona. Përafërsisht Kohëzgjatja e audios (Rapsi) 15-60 minutaMonoNdihma në ueb5.0.vala.jsonASR, Asistent Virtual, Chatbot, AI biseduese, Analiza e të folurit, TTS, Modelimi i gjuhësFemër 204, Mashkull 356, E panjohur 21

Shërbimet e ofruara

Mbledhja e të dhënave audio të ekspertëve nuk është e gjitha në dorë për konfigurime gjithëpërfshirëse të AI. Në Shaip, madje mund të merrni parasysh shërbimet e mëposhtme për t'i bërë modelet më të përhapura se zakonisht:

Mbledhja e të dhënave të tekstit

Mbledhja e të dhënave të tekstit
Sherbimet

Vlera e vërtetë e shërbimeve të mbledhjes së të dhënave njohëse Shaip është se u jep organizatave çelësin për të zhbllokuar informacionin kritik që gjendet brenda të dhënave të pastrukturuara

Mbledhja e të dhënave të imazhit

Shërbimet e mbledhjes së të dhënave të imazheve

Sigurohuni që modeli juaj i vizionit kompjuterik të identifikojë çdo imazh me saktësi, për të trajnuar pa probleme modelet e gjeneratës së ardhshme të AI të së ardhmes

Mbledhja e të dhënave video

Shërbimet e mbledhjes së të dhënave video

Tani përqendrohuni në vizionin kompjuterik së bashku me NLP për të trajnuar modelet tuaja për të identifikuar objektet, individët, parandaluesit dhe elementët e tjerë vizualë në përsosmëri

Na kontaktoni Shaip

Dëshironi të ndërtoni të dhënat tuaja audio?

Lidhu me ekspertin tonë të brendshëm të mbledhjes së të dhënave të të folurit për të ngritur një depo audio që i përshtatet më mirë kërkesës suaj

  • Duke u regjistruar, jam dakord me Shaip Politika e Privatësisë Kushtet e Shërbimit dhe të jap pëlqimin tim për të marrë komunikim marketingu B2B nga Shaip.

Mbledhja e të dhënave të të folurit për një model ML i referohet procesit të mbledhjes së regjistrimeve audio të gjuhës së folur. Ky koleksion ndihmon në trajnimin dhe rafinimin e algoritmeve të mësimit të makinerive, veçanërisht ato të përqendruara në të kuptuarit dhe përpunimin e zërave njerëzorë.

Kur synoni të grumbulloni të dhëna audio për njohjen automatike të të folurit (ASR), duhet të filloni duke përcaktuar nevojat specifike të projektit tuaj, duke përfshirë gjuhën e dëshiruar, theksin dhe llojin e të folurit. Pas vendosjes së këtyre parametrave, sigurohuni që të merrni të gjitha lejet e nevojshme për të respektuar privatësinë e përdoruesit. Më pas, përdorni pajisje ose softuer të përshtatshëm regjistrimi për të kapur mostra të qarta audio. Çdo regjistrim duhet të shënohet në mënyrë të përpiktë me transkriptimin e tij ose meta të dhëna të tjera përkatëse dhe të ruhet sistematikisht për qasje të lehtë.

Një grup i të dhënave të të folurit në mësimin e makinës është thelbësor për trajnimin, testimin dhe vërtetimin e modeleve të përshtatura për të njohur, transkriptuar ose interpretuar gjuhën e folur. Të dhëna të tilla hapin rrugën për një mori aplikacionesh, nga asistentët e zërit dhe shërbimet e transkriptimit te biometria e zërit.

Për mbledhjen e të dhënave të sakta nga gjuhë dhe thekse të ndryshme, bashkëpunimi me folësit vendas të prejardhjes së dëshiruar gjuhësore është jetik. Synoni për një mostër të larmishme dhe përfaqësuese për të mbuluar një spektër të gjerë nuancash demografike. Përdorni pajisje regjistrimi të standardizuara në mjedise uniforme për të siguruar qëndrueshmëri audio. Dhe më e rëndësishmja, shënoni çdo pjesë të të dhënave me transkriptime dhe meta të dhëna të detajuara, duke treguar gjuhën dhe theksin specifik.