• Login
    View Item 
    •   DSpace Home
    • C) Memorias de Título - Pregrado
    • Facultad de Ingeniería
    • View Item
    •   DSpace Home
    • C) Memorias de Título - Pregrado
    • Facultad de Ingeniería
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Combinación de métricas y rasgos léxico-semánticos para el análisis de similitud textual entre dos frases

    Thumbnail
    View/Open
    Sebástian Oliva Arenas.pdf (675.2Kb)
    Date
    2017-08
    Author
    Oliva Arenas, Sebástian Nicolás
    Publisher
    Universidad Católica de la Santísima Concepción
    Description
    Informe de Proyecto de Título para optar al Título de Ingeniero Civil Informático
    Metadata
    Show full item record
    Abstract
    A partir del procesamiento del lenguaje natural, ha surgido una gama de problemas a resolver durante los a˜nos, y uno de ellos ha sido la similitud sem´antica textual. La similitud sem´antica textual, problema que tiene aplicaciones en variados t´opicos, como por ejemplo en textos de resumen, traducci´on autom´atica, la mejora de la eficacia de los motores de b´usqueda sem´anticos, educaci´on como revisi´on de respuestas breves. Resolver y optimizar las aplicaciones de las ´areas en general tiene mucho inter´es en la comunidad cient´ıfica. Lo que hacen los algoritmos hoy en d´ıa es dar una puntuaci´on de similitud a las frases que se comparan a trav´es de ciertas m´etricas. Si bien se han hecho conferencias para resolver este tipo de problema, ya hay variados enfoques que dan una puntuaci´on a las frases similares, a´un no se ha logrado dar con un enfoque exacto para resolver este problema. Lo que propuso esta investigaci´on para abordar el problema, fueron cuatro enfoques combinando m´etricas tanto sem´anticas y l´exicas, desambiguando las frases de dos maneras distintas y entrenando los datos con algoritmos de aprendizajes autom´aticos. Por ende, una hip´otesis que sigui´o esta investigaci´on fue al combinar m´etricas tanto l´exicas como sem´anticas se puede obtener mejores resultados. Los experimentos realizados con el modelo propuesto en esta investigaci´on, permitieron ver que el enfoque A da mejores resultados, pero con la prueba de Wilcoxon se concluy´o que el enfoque A no tiene mayor relevancia que el enfoque B en los modelos utilizados (Random Forest, Dagging, Linear Regression, SMOreg).
    URI
    http://repositoriodigital.ucsc.cl/handle/25022009/1212
    Collections
    • Facultad de Ingeniería

    UCSC
    UCSC | Contact Us | Send Feedback
     

     

    Browse

    All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

    My Account

    Login

    Statistics

    View Usage Statistics

    UCSC
    UCSC | Contact Us | Send Feedback