Filtrarea conținutului se referă la un sistem automatizat implementat pentru a procesa volume mari de date și pentru a lua anumite măsuri în privința conținutului care îndeplinește anumite criterii. Editorii utilizează adesea soluții de filtrare text și media pentru a gestiona cea mai mare parte a conținutului generat de utilizatori pe site-ul lor. Aceste sisteme sunt frecvent implementate pentru a filtra conținut precum materiale destinate adulților și distribuirea ilegală de fișiere, precum și conținutul referitor la vânzarea de arme de foc, droguri, alcool și tutun.
Dezvoltarea unei soluții interne
Mulți editori preferă să-și dezvolte propriile sisteme de filtrare. Această decizie poate avea următoarele avantaje:
- filtrarea text poate fi codificată relativ ușor;
- aceste soluții sunt deseori mult mai ieftine decât soluțiile profesionale;
- editorul își cunoaște cel mai bine site-ul și utilizatorii și poate anticipa problemele privind politica mai bine decât oricine altcineva.
Crearea unei liste de cuvinte cheie
- alcătuiți propria listă de cuvinte și expresii pe care doriți să le filtrați. Vă puteți baza pe propria intuiție sau puteți obține ajutor:
- cereți-le angajaților dvs. să vină cu idei;
- solicitați ajutorul utilizatorilor;
- folosiți instrumentul pentru cuvinte cheie din Google Ads;
- pentru mai multe sugestii, consultați site-uri care găzduiesc conținut nedorit (de exemplu, site-uri pentru adulți și/sau pentru distribuirea de fișiere) și aflați ce cuvinte cheie sunt utilizate frecvent pe acestea.
- codificați propriul instrument de extragere automată a cuvintelor cheie:
- utilizați datele din motoarele de căutare pentru a accesa toate paginile unui site;
- preluați o listă de cuvinte și combinații de cuvinte unice de pe site-ul respectiv;
- păstrați cele mai frecvente cuvinte cheie și renunțați la celelalte. Nu uitați să eliminați articolele frecvente și cuvintele precum „un” sau „și”.
- includeți rezultatele într-un fișier text;
- repetați pașii de mai sus pentru mai multe site-uri, până când aveți o listă satisfăcătoare și ați terminat;
- Important: extragerea de conținut de pe alte site-uri și utilizarea acestuia drept conținut propriu încalcă Politicile Google pentru editori și Politicile privind spamul pentru căutarea Google pe web și poate fi ilegală și/sau neetică.
Nu toate cuvintele sunt egale, iar unele cuvinte cheie pot fi mai puțin relevante ca altele. De aceea, vă recomandăm să atribuiți diferite ponderi diferiților termeni.
De exemplu, filtrele pentru adulți ar trebui să acorde o pondere mai mare cuvântului „porno” decât cuvântului „sex”. În timp ce „porno” este legat aproape exclusiv de conținutul neadecvat pentru minori, „sex” se poate referi și la „gen”, în funcție de contextul în care este utilizat.
Luați în calcul și cuvintele care individual sunt sigure, dar în combinație cu alte cuvinte pot însemna cu totul altceva. De exemplu, cuvântul „fotografii” este inofensiv, însă „fotografii adolescenți” se referă adesea la pornografie.
Metoda 1 – Conținutul generat de utilizator este scanat după ce este afișat pe o pagină:
- scanați conținutul;
- semnalați dacă îndeplinește condițiile de filtrare;
- dezactivați difuzarea anunțurilor pe pagina care găzduiește conținutul respectiv;
- revizuiți manual conținutul:
- dacă este sigur, activați difuzarea anunțurilor și ajustați filtrele;
- dacă nu este sigur, asigurați-vă că acest conținut nu este afișat în paginile care includ codul de anunț.
Metoda 2 – Conținutul generat de utilizator este scanat înainte de a fi pus la dispoziția utilizatorilor:
- scanați conținutul;
- semnalați dacă îndeplinește condițiile de filtrare;
- puneți conținutul în așteptarea revizuirii sau respingeți-l direct;
- revizuiți manual conținutul:
- dacă este sigur, afișați-l în paginile care difuzează anunțuri și ajustați filtrele;
- dacă nu este sigur, dezactivați difuzarea anunțurilor și afișați-l sau respingeți-l.
Soluții comerciale pe scurt
Există mai multe servicii care oferă filtrare de conținut, inclusiv unele specializate în filtrarea anumitor tipuri, cum ar fi conținut pentru adulți sau protejat prin drepturi de autor. Există, de asemenea, platforme de crowdsourcing care creează o punte între editori și utilizatorii care vor să câștige bani fără efort cu ajutorul internetului. Cea mai bună modalitate de abordare este realizarea unei cercetări de piață cu privire la subiectul respectiv și stabilirea celei mai bune soluții pentru serviciul pe care îl oferiți. Încercați să consultați site-urile care analizează programe software și să vedeți ce tip de sisteme de filtrare a conținutului generat de utilizatori recomandă acestea. După ce ați strâns toate aceste informații, trebuie să decideți care este cea mai potrivită soluție pentru dvs., în funcție de scorul produselor, caracteristicile și funcțiile unice ale acestora, precum și modelul lor de preț.