Google Drive-bestanden automatisch labelen met AI-classificatie

Deze functie is inbegrepen bij Frontline Plus en Enterprise Plus. De functie is ook inbegrepen bij de add-ons Gemini Enterprise, Gemini Education Premium en AI Security. Add-ons vergelijken

De functie voor AI-classificatie gebruikt artificial intelligence (AI) om gevoelige content van uw organisatie automatisch te labelen. Na een eerste trainingsperiode, waarin het AI-model de criteria voor gevoelige content van uw organisatie leert, kan AI-classificatie automatisch labels toepassen op zowel nieuwe als bestaande bestanden in Google Drive.

Hier leest u hoe u aan de slag gaat met AI-classificatie:

1) Training instellen: Maak eerst het classificatielabel, dat door het AI-model automatisch wordt toegepast op bestanden nadat de training is afgerond. U maakt ook het trainingslabel, dat bijna identiek is aan het classificatielabel.

2) Het model trainen: Tijdens de trainingsperiode, die doorgaans een week duurt, gaan de aangewezen labelers (gebruikers in uw organisatie die gevoelige bestanden kunnen beoordelen) de Drive-bestanden classificeren met het trainingslabel. Aan de hand van hun voorbeelden leert het model hoe gevoelige bestanden op een vergelijkbare manier moeten worden geclassificeerd.

3) Automatische classificatie aanzetten: Nadat het model is getraind (na ongeveer een week), wordt u gevraagd automatische classificatie aan te zetten. U kunt doorlopend bijhouden hoeveel bestanden worden geclassificeerd en hoe nauwkeurig dit gebeurt.

Raadpleeg de gelinkte artikelen hieronder voor de exacte informatie over elke fase.

Voordat u begint

Training instellen

Het classificatielabel maken

Het classificatielabel is het label dat het AI-model automatisch toepast op uw gevoelige Drive-bestanden nadat het model is getraind. Het model wordt getraind op en gebruikt maar één veld per label. Het veld dat door AI is ingesteld moet een veldtype met een badge of optielijst zijn. Ga naar Aan de slag als Drive-labelbeheerder voor meer informatie over labels.

Als u een veld met een badge of optielijst als classificatielabel gebruikt, moet het aan deze vereisten voldoen:

  • Kies minimaal 2 en maximaal 7 opties
  • Moet worden gepubliceerd

Als u een bestaand label heeft dat aan deze vereisten voldoet, kunt u het gebruiken als classificatielabel. Anders maakt u een label.

Het trainingslabel maken

We raden u aan het trainingslabel tijdens de labelselectie te maken (volgende stap), wanneer u het automatisch kunt maken. Zo komt het trainingslabel op alle vereiste manieren overeen met het classificatielabel.

Als u ervoor kiest het trainingslabel voor de labelselectie te maken, doet u het volgende:

  • Zorg dat het label voldoet aan de vereiste labelcriteria.
  • Zoek het trainingslabel met het woord 'training'. zodat vertrouwde labelers het label makkelijker kunnen herkennen en toepassen tijdens de trainingsperiode.
  • Voeg een beschrijvingsveld toe aan het trainingslabel zodat vertrouwde labelers het doel beter begrijpen.

Labels selecteren en training aanzetten

  1. Log in met een beheerdersaccount op de Google Beheerdersconsole.

    Als u geen beheerdersaccount gebruikt, heeft u geen toegang tot de Beheerdersconsole.

  2. Klik bij AI-classificatie voor Google Drive op Training instellen.
  3. Klik bij Classificatielabel selecteren op Label selecteren.
  4. Selecteer het label dat u voor AI-classificatie wilt gebruiken en het veld dat moet worden ingesteld.
  5. Klik bij Trainingslabel selecteren op Trainingslabel maken.

    Er wordt automatisch een trainingslabel gemaakt met dezelfde kenmerken als uw classificatielabel.

  6. Klik op Labelrechten updaten zodat het nieuwe label beschikbaar is voor de aangewezen labelers. Het label wordt in de bewerkingsmodus in Labelbeheer geopend op een apart tabblad.

    Opmerking: u kunt labelrechten ook later instellen. Het is echter belangrijk dat alleen uw labelers toegang hebben tot het trainingslabel.

  7. Klik op Rechtenen danBewerken en geef de configuratiegroep met uw labelers het recht Mag labels toepassen en waarden instellen.
  8. Klik op Opslaan en sluit het tabblad Labelbeheer.

    Nadat u zowel het classificatie- als het trainingslabel heeft geselecteerd, is de knop Training aanzetten beschikbaar.

  9. Klik op Training aanzetten.

    Belangrijk: Als u een foutmelding krijgt wanneer u training probeert aan te zetten, betekent dit dat het classificatie- en trainingslabel niet overeenkomen. Controleer de labelvereisten hieronder en zorg dat uw labels aan alle vereisten voldoen. Zet training daarna aan.

Nadat u de training heeft aangezet, worden op de pagina Gegevensclassificatie het geselecteerde trainingslabel en classificatielabel weergegeven.

  • Bij Classificatielabel staat Nog niet klaar. Als de training klaar is, verandert de labelstatus in Klaar.
  • Bij Status automatisch toepassen staat Uit voor iedereen. Als de status van het classificatielabel Klaar is, kunt u de Status automatisch toepassen wijzigen in Aan.

Daarna moeten de aangewezen labelers het label Training toepassen op uw gevoelige bestanden.

Het model trainen

Uw aangewezen labelers moeten minstens 100 bestanden per optie labelen om het AI-model te trainen. Als uw label bijvoorbeeld 3 opties heeft, moet het in totaal op minstens 300 bestanden worden toegepast. Het AI-model controleert elke 1 tot 2 weken de training en krijgt de status Klaar nadat het voor elke labeloptie 100 of meer voorbeelden heeft. Meer informatie over voorbeelden van hoge kwaliteit

Tijdens de trainingsperiode kunt u de voortgang controleren voor het aantal bestanden dat is gelabeld en volgen hoe de nauwkeurigheid van het model verbetert.

Opmerking: Voor trainingsbestanden geldt een totale limiet van 1 miljoen.

Zo checkt u de voortgang tijdens de trainingsperiode:

  1. Ga in de Beheerdersconsole naar Beveiligingen danGegevensclassificatie.
  2. Klik op Modeldetails weergeven.
    • Bij Trainingslabel staat onder Trainingsbestanden het aantal bestanden met een label voor elke optie.
    • Elke labeloptie bevat een score voor het percentage trainingsvoorbeelden dat het model correct heeft geclassificeerd na de zelftest.
      • Laag: minder dan 50%. Het model heeft betere gegevens nodig en is nog niet klaar.
      • Gemiddeld: 50-80%. Het model is mogelijk in beperkte mate klaar.
      • Hoog: meer dan 80%. Het model is klaar om bestanden voor uw organisatie te classificeren.

Automatische toepassing van labels aanzetten

Nadat het AI-model is getraind om een hoge mate van nauwkeurigheid te bereiken, kunt u labelopties kiezen en automatische toepassing van labels aanzetten. Volg deze stappen:

  1. Ga in de Beheerdersconsole naar Beveiligingen danGegevensclassificatie.
  2. Verifieer bij AI-classificatie of het Classificatielabel de status Klaar heeft.
  3. Klik op Modeldetails weergeven.
  4. Vink bij Classificatielabel de vakjes aan voor de labelopties die het AI-model automatisch mag toepassen.
  5. Klik op Automatisch toepassen aanzetten.
  6. Zoek en selecteer de organisatie-eenheid of groep met de gebruikers voor wie labels automatisch moeten worden toegepast. Als u bijvoorbeeld de groep Financiën selecteert, kunt u daarna de labels selecteren die moeten worden ingesteld voor deze groep.
  7. Klik op Aan: Label wordt automatisch toegepast.

    De opties voor hoe het label wordt toegepast, staan onder de optie Aan.

  8. Klik op Opslaan.
  9. Op de hoofdpagina Gegevensclassificatie wordt de Status automatisch toepassen voor de regel gewijzigd in Aan.

Wanneer scant AI-classificatie bestanden?

AI-classificatie scant bestanden in rust minstens één keer op gebruikers en gedeelde Drives waarvoor automatische toepassing is aangezet. Dit proces kan 1 tot 2 weken duren nadat automatische toepassing voor het eerst is aangezet.

AI-classificatie scant ook bestanden als ze worden geüpload of aangepast. Het toegepaste label kan veranderen op basis van wijzigingen in de inhoud van het bestand.

Gebeurtenissen met betrekking tot AI-classificatielabels controleren in het Drive-logboek

U kunt specifieke informatie krijgen over hoe AI-classificatie bestanden labelt door de gebeurtenissen te controleren die zijn geregistreerd in het Drive-logboek.

  1. Ga naar Beveiligingen danGegevensclassificatie.
  2. Klik onder AI-classificatie voor Google Drive op Modeldetails weergeven.
  3. Klik op Logboeken weergeven.

    De tool voor beveiligingsonderzoek wordt geopend op een nieuw tabblad en toont zoekresultaten voor het Drive-logboek voor 2 gebeurtenissen gerelateerd aan AI-classificatie: Label toegepast en Veldwaarde van label gewijzigd.

  4. Klik op de Beschrijving van het evenement voor meer informatie, zoals:
    • De naam en het type van het document dat is gelabeld.
    • De veldwaarde van het label die is toegewezen aan het document (bijvoorbeeld Vertrouwelijk of Beperkt, als dat uw labelopties zijn).

Automatische toepassing van labels uitzetten

U kunt automatische toepassing van alle labels uitzetten of specifieke opties uitzetten.

  1. Ga naar Beveiligingen danGegevensclassificatie.
  2. Klik onder AI-classificatie voor Google Drive op Modeldetails weergeven.
    • Vink voor Classificatielabel Toestaan uit in de kolom Automatisch toepassen om automatisch toepassen voor die optie te onderbreken.
    • Als u automatische toepassing helemaal wilt onderbreken, vinkt u alle opties uit.
Automatische toepassing helemaal uitzetten voor specifieke organisatie-eenheden of groepen

Gebruik deze optie als u automatische toepassing helemaal wilt uitzetten voor content die eigendom van gebruikers in specifieke organisatie-eenheden of groepen is.

  1. Ga naar Beveiligingen danGegevensclassificatie.
  2. Klik onder AI-classificatie voor Google Drive op Modeldetails weergeven.
  3. Klik op Automatisch toepassen beheren.
  4. Klik links op een organisatie-eenheid of groep om deze te selecteren.
  5. Klik bij Automatisch toepassen door AI beheren op UIT.

Het model resetten

Het kan zijn dat u het model op een bepaald moment moet resetten (bijvoorbeeld om een nieuwe test te starten of omdat het model niet nauwkeuriger wordt). Als u het model moet resetten, dient u rekening te houden met het volgende:

  • Wacht totdat het model is getraind als u dit wilt resetten. Pas daarna kan AI-classificatie het nieuwe classificatielabel aanzetten en toepassen op de bestanden.
  • De bestanden behouden eerder toegepaste trainingslabels. Nadat u het model heeft gereset, kunt u een nieuw model instellen om hetzelfde (of een ander) trainingslabel te gebruiken.
  • Bestanden behouden automatisch toegepaste labels nadat u het model heeft gereset.
  • Als u hetzelfde classificatielabel kiest voor het nieuwe model, negeert en overschrijft de functie voor AI-classificatie de voorspellingen van eerdere modellen. Op deze manier kunt u het model resetten zodat Drive-bestanden van uw organisatie 'opnieuw worden verwerkt'. Dit kan nuttig zijn als u de modelkwaliteit sinds de eerste implementatie aanzienlijk heeft verbeterd.
  1. Ga naar Beveiligingen danGegevensclassificatie.
  2. Klik onder AI-classificatie voor Google Drive op Modeldetails weergeven.
  3. Ga naar de detailpagina van het AI-model en klik rechts bij Acties op Model resetten.

    Het dialoogvenster Model resetten bevat de gevolgen van het resetten van het model.

  4. Klik op Model resetten om door te gaan.

    De oorspronkelijke status van AI-classificatie wordt teruggezet. Begin opnieuw door op Training instellen te klikken en nieuwe classificatie- en trainingslabels te kiezen.

Veelgestelde vragen

Alles uitvouwen  |  Alles samenvouwen

Wat zijn de vereisten voor de trainings- en classificatielabels?

Zowel het classificatie- als het trainingslabel moet voldoen aan de volgende criteria:

  • Kies minimaal 2 en maximaal 7 opties.
  • Zet de opties in dezelfde volgorde in elk label. Als het classificatielabel bijvoorbeeld opties in deze volgorde bevat,

    De opties voor trainingslabels kunnen niet op deze manier worden geordend:

    • 1. Optie 1
    • 2. Optie 2
    • 3. Optie 3
    • 1. Optie 2
    • 2. Optie 1
    • 3. Optie 3
  • Bevatten gepubliceerde labels.
  • Bevatten labels met verschillende toegangsrechten. Het trainingslabel mag alleen beschikbaar zijn voor aangewezen labelers aan wie u het kunt overlaten om het model te trainen. Het classificatielabel kan bredere toegangsrechten hebben.
Kan ik het classificatielabel gebruiken als trainingslabel?
Nee. Het classificatie- en trainingslabel moeten verschillend zijn. Het label dat u kiest als classificatielabel, wordt niet getoond als selecteerbare keuze voor het trainingslabel.
Met welke bestanden kan ik het model goed trainen?

Voor de beste resultaten bij het trainen van het model moeten vertrouwde labelers deze richtlijnen volgen bij het kiezen van trainingsbestanden:

  • Zorg dat elk bestand minstens ongeveer 500 teksttekens bevat.
  • Selecteer bestanden die het beste de werkelijke content weergeven die uw gebruikers in uw organisatie maken, delen en gebruiken
  • Selecteer ongeveer hetzelfde aantal bestanden per labeloptie, met minstens 100 bestanden voor elke optie. Zo krijgt het model meer inzicht in uw gegevens en kunnen de scores worden verbeterd.
  • Gebruik voor elk optietype een representatieve verscheidenheid aan bestanden. Label bijvoorbeeld niet 100 cv's als uw totale reeks voorbeeldbestanden voor Topgeheim als contractbestanden ook vaak als Topgeheim worden gemarkeerd in uw organisatie.
Werkt AI-classificatie alleen om gevoelige content te labelen?
Gevoelige content is het belangrijkste doel bij AI-classificatie, maar labels met maximaal 4 opties kunnen worden getraind voor automatisch labelen.
Kan het model in meerdere talen worden getraind?
Het model ondersteunt meerdere talen. maar een representatieve verscheidenheid aan bestanden voor elk optietype en elke taal moet worden opgenomen in de trainingsgegevens. Hierdoor heeft u meer bestanden nodig om het model te trainen. Schrijfsystemen zonder woordgrenzen, zoals Japans en Chinees, worden nog niet ondersteund.
Hoe worden scores berekend?
Tijdens de training gebruikt het AI-model 75% van de invoergegevens om zichzelf te trainen voor het labelen van bestanden. Het reserveert 25% om periodiek de eigen prestaties te testen. Met andere woorden, 25% van de gelabelde bestanden analyseert het model alsof het niet weet welk label is toegepast. Het AI-model maakt dan een eigen labelkeuze en vergelijkt die keuze met het daadwerkelijke label dat door de aangewezen labeler is toegepast. De scores tonen aan welk deel van de gereserveerde bestanden het juiste label correct is toegewezen.
Wat gebeurt er als een optie uitstaat voor automatische toepassing?
Als er tijdens de scan wordt voorspeld dat automatische toepassing is uitgezet voor een optie van een bestand, past AI-classificatie geen label of veldwaarde toe op dat bestand.

Bestanden die door AI-classificatie zijn gelabeld, blijven de toegepaste label- en optiewaarden behouden, zelfs nadat de optie is uitgezet.

Hoe en wanneer herziet AI-classificatie de automatisch toegepaste labels?

Nadat het model is gemaakt en automatische toepassing is aangezet, scant en classificeert AI-classificatie alle gegevens in rust waarvoor voldoende tekst kan worden geëxtraheerd. Deze bestanden zijn minstens één keer gescand.

AI-classificatie verwerkt bestanden periodiek opnieuw naarmate de inhoud wordt aangepast. Contentwijzigingen kunnen leiden tot een andere voorspelling voor een bestand. Als AI-classificatie zowel een oude als een nieuwe voorspelde optie voor een bestand heeft, geeft AI-classificatie de voorkeur aan de optie die hoger in de lijst met opties staat. Stel dat een veld 3 opties heeft in Labelbeheer:

  • Vertrouwelijk
  • Intern
  • Openbaar

Stel dat AI-classificatie een bestand classificeert als Intern en de inhoud verandert zodat het AI-classificatiemodel Vertrouwelijk voorspelt. In dat geval wordt de classificatie van het bestand gewijzigd in Vertrouwelijk. Maar als het AI-classificatiemodel Openbaar voorspelt, blijft het bestand geclassificeerd als Intern.

AI-classificatie herziet automatisch toegepaste labels en veldwaarden die zijn beoordeeld of gewijzigd door gebruikers niet.

Welk mechanisme krijgt prioriteit bij de classificatie van bestanden bij meerdere classificatiemechanismen, zoals AI, DLP-regels en standaardclassificatie?
Gegevensclassificatie wordt in deze volgorde uitgevoerd:
  1. DLP-regel zonder overschrijving door gebruiker
  2. Handmatige classificatie
  3. DLP-regel met overschrijving door gebruiker
  4. AI-classificatie
  5. Standaardclassificatie
Als u een label of veld verwijdert, kan een lager classificatiemechanisme van kracht worden. Stel dat een gebruiker een label van een bestand verwijdert. Later kan dan hetzelfde label automatisch worden toegepast door AI-classificatie.
Gelden er beperkingen voor de bestandstypen waarop labels kunnen worden toegepast?
  • U kunt elk Drive-item labelen vanuit Drive. De editor heeft ook native labels voor de gebruikerservaring.
  • AI-classificatie gebruikt dezelfde indexeerbare tekstverwerking als Drive DLP. Elk bestand waaruit Drive indexeerbare tekst kan extraheren, kan worden geëvalueerd voor labels die door AI Classification worden toegepast. Het is niet mogelijk om indexeerbare tekst uit elk bestand te extraheren. Daarom is er geen garantie dat AI-classificatie elk bestand kan verwerken.
  • Een bestand moet voldoen aan een minimale tekstdrempel voordat AI-classificatie een classificatiebeslissing neemt. Daardoor worden sommige bestanden misschien niet geclassificeerd, zoals zeer korte documenten en afbeeldingen met weinig tekst.
Hoe werkt de functie voor gebruikers zonder geschikte licentie?
Zolang sommige gebruikers in het domein een geschikte licentie hebben waarmee AI-classificatie wordt ondersteund, kan uw beheerder het model trainen. Bestanden met het trainingslabel kunnen eigendom zijn van alle gebruikers met een licentie die Drive-labels ondersteunt. De functie voor automatische toepassing past alleen labels toe op bestanden die eigendom zijn van gebruikers met een licentie die AI-classificatie ondersteunt. Bestanden waarvan gebruikers zonder ondersteunde licentie de eigenaar zijn, worden niet verwerkt door de AI.

Gerelateerd onderwerp

Aan de slag als Drive-labelbeheerder

Was dit nuttig?

Hoe kunnen we dit verbeteren?
Zoeken
Zoekopdracht wissen
Zoekfunctie sluiten
Hoofdmenu
18391984557441069278
true
Zoeken in het Helpcentrum
true
true
true
true
true
73010
false
false
false
false