Le indagini scientifiche sono caratterizzate universalmente dalla capacità di convalidare i modelli e gli esiti della ricerca attraverso il rigore della misura quantitativa, che esprime da un lato una definizione sistematica degli obbiettivi e dall'altra una forma oggettiva di giudizio e confronto tra idee diverse. Questo atteggiamento si è rivelato particolarmente fecondo in AI nel passaggio dalla ricerca di laboratorio degli anni 70'-80' agli attuali successi tecnologici. Il campo della elaborazione del linguaggio (o NLP) è stato fortemente interessato dal fenomeno sin dagli anni '80, anni in cui le valutazioni comparative stimolate dalla agenzia americana ARPA hanno costituito il nucleo di eventi annuali della comunità internazionale, quali le campagne di benchmarking dei sistemi di analisi linguistica in problemi inerenti al livello semantico (come ad esempio la traduzione automatica ed il question answering), o grammaticale (parsing). In questo incontro verrà discussa l'iniziativa nazionale EvalIta, progettata e sostenuta dalla comunità di AI e NLP italiana, che pubblica con cadenza biennale gli esiti di campagne valutative inerenti agli strumenti per l'analisi della lingua italiana.