Rast Studimi: Moderimi i përmbajtjes
Mbi 30 mijë ueb dokumente të hequra dhe të shënuara për Moderimin e përmbajtjes
që përpiqen të sigurojnë hapësirën online ku ne lidhemi dhe komunikojmë.
Ndërsa përdorimi i mediave sociale vazhdon të rritet,
problemi i bullizmit kibernetik është shfaqur si a
pengesë e rëndësishme për platformat që përpiqen
siguroni një hapësirë të sigurt në internet. Një tronditëse
38% e individëve e hasin këtë
sjellje të dëmshme në baza ditore,
duke theksuar kërkesën urgjente për shpikës
qasjet e moderimit të përmbajtjes.
Organizatat sot mbështeten në përdorimin e
inteligjencës artificiale për të adresuar të qëndrueshme
problemi i bullizmit kibernetik në mënyrë proaktive.
Siguria kibernetike:
Zbulohet Raporti i Zbatimit të Standardeve të Komunitetit të tremujorit të katërt të Facebook – veprim mbi 4 milionë pjesë të përmbajtjes ngacmuese dhe ngacmuese, me një shkallë zbulimi proaktiv prej 6.3%
Edukimi:
A 2021 studimi zbuloi se 36.5%% e nxënësve në Shtetet e Bashkuara midis moshave 12 & 17 vite përjetuan ngacmim kibernetik në një moment ose në një tjetër gjatë shkollimit të tyre.
Sipas një raporti të vitit 2020, tregu global i zgjidhjeve të moderimit të përmbajtjes u vlerësua në 4.07 miliardë dollarë në 2019 dhe pritej të arrinte 11.94 miliardë dollarë deri në vitin 2027, me një CAGR prej 14.7%.
Zgjidhja e botës reale
Të dhëna që moderon bisedat globale
Klienti po zhvillonte një të automatizuar të fortë
moderimi i përmbajtjes Mësimi i makinerisë
model për ofertën e saj Cloud, për të cilën ata
po kërkonin për shitës specifik për domenin i cili
mund t'i ndihmonte ata me të dhëna të sakta të trajnimit.
Duke shfrytëzuar njohuritë tona të gjera në përpunimin e gjuhës natyrore (NLP), ne ndihmuam klientin në mbledhjen, kategorizimin dhe shënimin e më shumë se 30,000 dokumenteve në anglisht dhe spanjisht për të ndërtuar modelin e automatizuar të moderimit të përmbajtjes së të mësuarit të makinerisë, i dyfishuar në përmbajtje toksike, të pjekur ose eksplicite seksuale. kategoritë.
Problem
- Web scraping 30,000 dokumente në spanjisht dhe anglisht nga domenet prioritare
- Kategorizimi i përmbajtjes së mbledhur në segmente të shkurtra, të mesme dhe të gjata
- Etiketimi i të dhënave të përpiluara si përmbajtje toksike, të pjekura ose seksualisht eksplicite
- Sigurimi i shënimeve me cilësi të lartë me një minimum prej 90% saktësi.
Zgjidhje
- Uebi i fshirë 30,000 dokumente secili për spanjisht dhe anglisht nga BFSI, Kujdesi Shëndetësor, Prodhimi, Shitja me pakicë. Përmbajtja u dyfishua më tej në dokumente të shkurtra, të mesme dhe të gjata
- Etiketimi me sukses i përmbajtjes së klasifikuar si përmbajtje toksike, të pjekur ose seksualisht eksplicite
- Për të arritur cilësinë 90%, Shaip zbatoi një proces kontrolli të cilësisë me dy nivele:
» Niveli 1: Kontrolli i Sigurimit të Cilësisë: 100% e skedarëve do të vërtetohen.
» Niveli 2: Kontrolli i analizës kritike të cilësisë: Ekipi CQA i Shaips për të vlerësuar 15%-20% të mostrave retrospektive.
Rezultat
Të dhënat e trajnimit ndihmuan në ndërtimin e modelit ML të moderimit të automatizuar të përmbajtjes që mund të japë disa rezultate të dobishme për ruajtjen e një mjedisi më të sigurt në internet. Disa nga rezultatet kryesore përfshijnë:
- Efikasiteti për të përpunuar një sasi të madhe të dhënash
- Konsistenca në sigurimin e zbatimit uniform të politikave të moderuara
- Shkallueshmëria për t'u përshtatur me bazën në rritje të përdoruesve dhe vëllimet e përmbajtjes
- Moderimi në kohë reale mund të identifikojë dhe
hiqni përmbajtjen potencialisht të dëmshme ndërsa krijohet - Efektiviteti i kostos duke reduktuar varësinë nga moderatorët njerëzorë
Shembuj të moderimit të përmbajtjes
Na tregoni se si mund të ndihmojmë me iniciativën tuaj të ardhshme për AI.