Netspeak, schrijfassistent voor het Engels
Onderzoekers van de Web Technology & Information Systems onderzoeksgroep aan de Technische Universität Weimar hebben een tool ontwikkeld die je kan gebruiken als schrijfassistent. Netspeak is een webservice die (meer) intelligente queries zoals interested ? computers verwerkt en een lijst teruggeeft met de meest frequente woorden die in de plaats van het vraagteken kunnen komen. Er worden bovendien verschillende voorbeeldzinnen weergegeven, waardoor de gebruiker de woorden in context ziet. Wanneer er verschillende mogelijkheden zijn, is die context vaak doorslaggevend. (Vrouwen niet geïnteresseerd in computers? I beg ? disagree)
Op die manier ontsnapt de tool voor een stuk aan de kritiek die veel taalwetenschappers hebben op het 'Zoek het op in Google'-advies. Gewone Google-lookup - kijken welke van je opties (bijvoorbeeld interested in computers en interested at computers) het meest frequent voorkomt - heeft als nadeel dat je wel de meest frequente optie kiest, maar daarom niet de beste. Een derde, niet geteste, optie zou wel eens de juiste kunnen zijn.
De contextinformatie en frequenties zijn gebaseerd op een gigantische collectie van websites (gedownload en verwerkt door Google) waaruit n-grams werden geëxtraheerd. De frequentie van elk van de resulterende n-grams - opeenvolgingen van n woorden - wordt geteld in het ganse corpus. Zo bevat dit corpus een schat aan informatie over veel voorkomende uitdrukkingen (zogenamde multi-word expressions) en de meest frequente voorzetsels bij een werkwoord.
Meer weten? Bezoek de projectpagina.Geschreven in Artificiële intelligentie Permalink
-
Reacties :
- (0)
- Reacties
- Print dit artikel






Taal&TechnologieBlog









