Të dhënat e çekut bankar (UA e dokumentit)
Çeku bankar sintetik
Përdorni rastin: OCR
Format: .jpg
Count: 2023
annotation: jo
Përshkrim: Grupi i të dhënave të çekut bankar (Dokumenti AI): Çeqet bankare sintetike përbëhen nga imazhe të çeqeve të krijuara artificialisht, të krijuara për të përsëritur pamjen dhe përmbajtjen e çeqeve reale. Ai përfshin elementë të ndryshëm si emrat e përfituesve, shumat, datat, nënshkrimet dhe numrat e çeqeve. Ky grup të dhënash përdoret për trajnimin dhe vlerësimin e sistemeve të Dokumentit AI në detyra si njohja optike e karaktereve (OCR), përpunimi i kontrollit dhe nxjerrja e automatizuar e të dhënave, duke ofruar një mjedis të kontrolluar për zhvillimin e modelit pa shqetësimet e privatësisë së çeqeve reale.
Gjendja e regjistrimit: - Imazhet e klikuara - Skanuar - Skraper ueb
Paketa e të dhënave të pasqyrave bankare (UA e dokumentit)
Pasqyra bankare sintetike
Përdorni rastin: OCR
Format: .jpg, png
Count: 5366
annotation: jo
Përshkrim: Grupi i të Dhënave të Pasqyrave Bankare (Dokumenti AI): Pasqyrat bankare sintetike përfshijnë pasqyra bankare të krijuara artificialisht të krijuara për të simuluar dokumente reale financiare. Ai përmban të dhëna të ndryshme të transaksioneve, data, shuma dhe detaje të llogarisë, të strukturuara për të pasqyruar formatet dhe përmbajtjen e botës reale. Ky grup të dhënash përdoret për trajnimin dhe vlerësimin e sistemeve të Dokumentit AI në detyra të tilla si njohja optike e karaktereve (OCR), nxjerrja e të dhënave dhe analiza e dokumenteve, duke ofruar një mjedis të kontrolluar pa çështjet e privatësisë së të dhënave aktuale financiare.
Gjendja e regjistrimit: - Skanuar - Pasqyra_Banke - Skraper Web
Të dhënat e faturave kineze
Kutia kufizuese + Teksti
Përdorni rastin: OCR
Format: Imazh
Count: 6k
annotation: Po
Përshkrim: Grupi i të dhënave të faturave kineze përfshin imazhe ose mostra teksti të llojeve të ndryshme të faturave, të tilla si fatura, fatura dhe deklarata, të shkruara në gjuhën kineze. Ai përmban formate dhe përmbajtje të ndryshme, duke përfshirë përshkrimet e artikujve, shumat dhe datat. Ky grup të dhënash përdoret për detyra si njohja optike e karaktereve (OCR), përpunimi i dokumenteve financiare dhe nxjerrja e automatizuar e të dhënave.
Seti i të dhënave të fletëpagesave (UA e dokumentit)
Përdorni rastin: OCR
Format: .jpg
Count: 2010
annotation: jo
Përshkrim: Seti i të dhënave të Fletëpagesave (Dokumenti AI): Fletëpagesat sintetike përbëhen nga imazhe të fletëpagesave të krijuara artificialisht pa asnjë shënim. Ai përmban formate dhe detaje të ndryshme të fletëpagesave si emrat e punonjësve, pagat dhe datat, të përdorura për trajnimin dhe testimin e sistemeve të AI të dokumenteve në detyra si OCR dhe përpunimi i dokumenteve.
Gjendja e regjistrimit: - I skanuar - Skraper ueb
Grupi i të dhënave të tekstit të rregullt/kursive të printuar (UA e dokumentit)
Përdorni rastin: Dokumenti AI
Format: HEIC (imazhe) dhe .mov (video)
Count: 23930
annotation: jo
Përshkrim: Fotografitë e drejtpërdrejta me tekst të shkruar me dorë për japonisht, koreanisht dhe rusisht
Pajisja e regjistrimit: Kamera e iPhone dhe iPad
Gjendja e regjistrimit: - Ndriçim agresiv/Shkëlqim - Blic i kamerës i ndezur - Dritë me ngjyra - Dritë e ulët, pa blici i kamerës - normale