Skip to content

Identificación de los elementos del front #61

@eduranm

Description

@eduranm

Descrição da nova funcionalidade

Incorporar al flujo de markup_doc la identificación automática de los elementos del front de un artículo, para extraer DOI, sección, títulos, autores, afiliaciones, resumen, palabras clave y fechas a partir del primer bloque del documento y persistirlos en la estructura marcada del artículo.

Critérios de aceitação

  • Procesar el primer bloque del artículo

  • Registrar el endpoint

  • Incorporar soporte para identificar y estructurar elementos del front, incluyendo:

    • <abstract>
    • <kwd-group>
    • <date-accepted>
    • <date-received>
  • El procesamiento de <abstract> debe generar:

    • un bloque paragraph con <abstract-title>;
    • un bloque paragraph_with_language con <abstract> y el idioma detectado.
  • El procesamiento de <kwd-group> debe:

    • extraer el título del bloque;
    • separar las palabras clave;
    • generar un bloque paragraph con <kwd-title>;
    • generar un bloque paragraph_with_language con <kwd-group> y el idioma detectado.

Anexos

  • Este issue incorpora la base para identificar automáticamente los elementos del front del artículo y exponer una API reutilizable para procesar el primer bloque del documento.

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions