En este momento (2017), el proyecto de código abierto más activo que implementa esto parece ser Anystyle Parser (última versión 07-2016). Se puede usar a través de una interfaz web, API o descargarse como RubyGem.
Mencionan explícitamente en su sitio web que la implementación está inspirada en ParsCit (última versión 2013?) Y FreeCite (último commit 2009).
También forman su sitio web:
AnyStyle Parser utiliza poderosas heurísticas de aprendizaje automático basadas en campos aleatorios condicionales que pueden ser entrenados por todos utilizando nuestro editor incorporado.
Esa es una característica realmente genial, que hace que esta sea la implementación más interesante (en mi humilde opinión). La capacitación parece ser bastante sencilla, como se explica en la documentación de la API . Simplemente proporciona algunos resultados corregidos manualmente y ejecuta el Anystyle.parser.train
comando. No estoy seguro de si ParsCit y FreeCite también admiten esto, pero si no lo hacen, esto me parece una gran diferencia de características.