Apprentissage de fonctions d�ordonnancement avec un flux de donn�es non-�tiquet�es
Vinh Truong(1), Massih-Reza Amini(2), Patrick Gallinari
(1) Laboratoire d'Informatique Paris 6
(2) National Research Council Canada
104, avenue du pr�sident
Kennedy
123,
boulevard Alexandre Tach�
75016 Paris
Gatineau, Canada
Dans ce papier, nous traitons de l�apprentissage de fonctions d�ordonnancement
bipartite avec des donn�es partiellement �tiquet�es. Contrairement
aux �tudes pr�c�dentes, nous supposons que les donn�es non-�tiquet�es arrivent
en grande quantit� de fa�on s�quentielle. Ce cadre �vite de garder en m�moire
toute la base d�apprentissage et permet de traiter les applications de routage d�information
faisant intervenir des flux de donn�es. La m�thode propos�e peut �tre
vue comme une extension des mod�les auto�apprenants propos�s en classification
semi�supervis�e. Le mod�le est d�abord initialis� sur les instances �tiquet�es
puis traite � la vol�e les donn�es non-�tiquet�es en continu. Notre algorithme
se base sur une m�thode d�optimisation en ligne des SVMs lin�aires. Les exp�riences
men�es sur un grand nombre de collections montrent que le flux de donn�es
non-�tiquet�es permet d�am�liorer les performances d�une fonction apprise
uniquement sur les instances �tiquet�es.