Apprentissage de fonctions d�ordonnancement avec un flux de donn�es non-�tiquet�es


Vinh Truong(1), Massih-Reza Amini(2), Patrick Gallinari
(1) Laboratoire d'Informatique Paris 6              (2) National Research Council Canada
              104, avenue du pr�sident Kennedy                     123, boulevard Alexandre Tach�         
                  75016 Paris                                                   Gatineau, Canada         


Dans ce papier, nous traitons de l�apprentissage de fonctions d�ordonnancement bipartite avec des donn�es partiellement �tiquet�es. Contrairement aux �tudes pr�c�dentes, nous supposons que les donn�es non-�tiquet�es arrivent en grande quantit� de fa�on s�quentielle. Ce cadre �vite de garder en m�moire toute la base d�apprentissage et permet de traiter les applications de routage d�information faisant intervenir des flux de donn�es. La m�thode propos�e peut �tre vue comme une extension des mod�les auto�apprenants propos�s en classification semi�supervis�e. Le mod�le est d�abord initialis� sur les instances �tiquet�es puis traite � la vol�e les donn�es non-�tiquet�es en continu. Notre algorithme se base sur une m�thode d�optimisation en ligne des SVMs lin�aires. Les exp�riences men�es sur un grand nombre de collections montrent que le flux de donn�es non-�tiquet�es permet d�am�liorer les performances d�une fonction apprise uniquement sur les instances �tiquet�es.