Techniek

Wat is een gegeven en hoe communiceert het met artificiële intelligentie?

Een gegeven is de basisbeschrijving van een zaak, een gebeurtenis, een transactie, enz. Gegevens kunnen talrijke vormen aannemen en zijn niet noodzakelijk digitaal: de vermeldingen in een overeenkomst op papier zijn ook gegevens.

In de informatica zijn gegevens (of "data") erg belangrijk. Het is de brandstof op basis waarvan computerprogramma's kunnen draaien, en die ze kunnen verwerken via hun algoritmen.

Wij maken een onderscheid tussen gestructureerde en ongestructureerde gegevens:

• Gestructureerde gegevens zijn gegevens die zijn georganiseerd en geformatteerd om in eenzelfde format te worden verzameld. Zij kunnen in databanken worden geïntegreerd. Het gaat bijvoorbeeld om een Excel-werkblad of een streepjescode. Doorgaans zijn het kwantitatieve gegevens, namelijk cijfers.

• Ongestructureerde gegevens zijn gegevens die in hun oorspronkelijke format zijn bewaard en niet zijn verwerkt. Hun format is zeer uiteenlopend en zij zijn kwalitatief van aard. Het kan gaan om e-mails zijn, satellietbeelden, door sensoren opgehaalde gegevens, berichten op sociale netwerken, enz.

Tot voor kort konden alleen gestructureerde gegevens door IT-instrumenten worden verwerkt, omdat ze door hun precieze en georganiseerde aard eenvoudig te beheren waren. Nochtans zijn ongestructureerde gegevens ook een goudmijn, en de nieuwste innovaties zijn daarop gericht.

Hier komt artificiële intelligentie om de hoek kijken. AI-algoritmen hebben gegevens nodig om te kunnen leren en om doeltreffend te kunnen functioneren. 

De hoeveelheid en het soort gegevens die nodig zijn varieert naargelang de leermethode:

• Bij traditioneel machinaal leren, d.w.z. machine learning, zal AI veel doeltreffender en vlotter verlopen met reeds gestructureerde gegevens. Om het algoritme te trainen zijn menselijke acties nodig om te definiëren welke specifieke variabelen moeten worden geanalyseerd en om aan te geven of het verkregen resultaat juist was of niet.

• Met methoden voor diep leren, d.w.z. deep learning, kunnen AI-algoritmen daarentegen omgaan met ongestructureerde gegevens. Er zijn geen menselijke acties nodig om ze te trainen zodra het leerproces is opgestart, en ze hebben enorme hoeveelheden gegevens nodig om het gewenste intelligentieniveau te bereiken.

Dat valt mee, want het aantal (al dan niet gestructureerde) gegevens neemt de laatste jaren enorm toe. Alle interacties (chats, transacties, video's, enz.) die op internet beschikbaar zijn, zijn bruikbare gegevens. Alle geconnecteerde objecten die deel uitmaken van ons dagelijks persoonlijk leven (smartphones, horloges, koelkasten, kleding, auto's, enz.) en van ondernemingen (diverse sensoren, geconnecteerde machines, enz.) brengen ook gegevens voort. Tot slot creëren de interacties die al deze objecten via internet met elkaar hebben zelf nieuwe gegevens: dit is het "internet der dingen"

Om deze exponentieel toenemende hoeveelheid gegevens, die niet met traditionele middelen kan worden verwerkt, te kwalificeren, hebben specialisten een naam gevonden: "big data". Het bestaan en de beginnende exploitatie ervan liggen aan de basis van de huidige opkomst van artificiële intelligentie, en in het bijzonder van deep learning.

Klik op de microfoon en stel uw vraag
Chatbot
Bezoek onze FAQ om het antwoord op al uw vragen te ontdekken.
De stemfunctie is niet beschikbaar op uw browser. Gelieve een recentere browser te gebruiken.