Skip to content

Projet de Fin d'études - EISTI Pau - Réalisation d'une application Web de structuration sémantique d'articles d'actualités

Notifications You must be signed in to change notification settings

deoliveiraromain/pfe-semantic-news

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

-------------------------------------------------------------------------------------------------------
--------------------- SEMANTAG, structuration sémantique d'articles d'actualités ----------------------
-------------------------------------------------------------------------------------------------------

--------------
Auteurs
--------------

    Romain De Oliveira, David Dogneton, Maxime Gautré et Thibault Goustat

--------------
Objectifs
--------------

L’ambition de ce projet est de structurer sémantiquement les articles d’actualités du Web récupérés depuis leurs flux RSS.
Cette structuration est permise par une annotation des titres et descriptions de chaque flux grâce au projet open source DBpedia Spotlight,
qui détecte dans un texte donné des entités DBpedia.

L’idée est ici d’associer la notion d’annotation à celle de tag. Nous stockons en base de données des articles et leurs tags associés,
qui sont en réalité des entités DBpedia. Ces tags permettent de lier les articles similaires et d’agréger les articles concernant
l’entité DBpedia correspondante.

Afin de tirer davantage partie de cette quantité massive d’informations, nous souhaitons :
    - Proposer un maximum d’analyses statistiques, qui permettront notamment de connaître en un coup d’oeil le contenu de l’actualité journalière,
      hebdomadaire, mensuelle, ...
    - Proposer un système de recommandation personnalisée aux utilisateurs connectés en fonction de leur historique de consultations
      (recommandation automatique) et de leurs goûts (recommandation contrôlée)


--------------
Installation
--------------

L'application a besoin de plusieurs choses :

    - la base de données : pour cela, il suffit de télécharger Neo4j, nous avons utilisé la version 2.0.1. Il faut ensuite démarrer la base sur le port 7474
      (port par défaut)

    - l'annotateur :
            - il faut télécharger le jar pour pouvoir effectuer l'annotation des artciles. Le jar est disponible à l'adresse suivante, http://spotlight.sztaki.hu/downloads/
            - il faut également télécharger l'archive fr.tar.gz qui contient le dictionnaire français.
            - décompresser l'archive fr.tar.gz => donne un dossier fr
            - pour lancer le jar, il faut se placer dans le dossier où se trouve le jar et exécuter la commande suivante :
                    java -Xmx4G -jar .\dbpedia-spotlight-0.7.jar .\chemin_du_dossier_fr http://localhost:2222/rest

    - l'application play : créer une nouvelle application play, nous avons utilisé la version 2.2.1.

    - pour récupérer les sources du projet, git clone git@github.com:david-dogneton/pfe-semantic-news.git


About

Projet de Fin d'études - EISTI Pau - Réalisation d'une application Web de structuration sémantique d'articles d'actualités

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • JavaScript 54.5%
  • Scala 29.6%
  • HTML 11.9%
  • Java 2.5%
  • CSS 1.5%