Digitization of protected works: Software for the detection of out of commerce works
DOI:
https://doi.org/10.3145/epi.2019.nov.24Keywords:
Out-of-commerce works, Bibliographic catalogues, Bibliographic comparator, Web scraping, Parser, Out-of-print-works, Computer programmes, Libraries, Book, Digitization.Abstract
The digitization of protected works in the context of cultural preservation is becoming more important, according to the latest proposal of the European Commission directive on copyright in the digital single market, pending final approval. This may represent an opportunity for European libraries, which can create digital collections with those works that are manifestly outside commercial channels. This requires a set of computer programs capable of extracting information from catalogs, and provide a first detection of the owners of the works. This research approach the methodology for the development of a software capable of crossing information from library bibliographic catalogs, with commercial catalogs, in order to determine the presence or absence of their books. In its development, the difficulties and solutions used for its construction are explained, derived from the heterogeneity of the consulted catalogs. Finally, it is concluded that the creation of this type of computer applications is feasible and very useful, since an average of more than 90% correct answers can be obtained in the distinction of non-commercial works. However, there are still problems when trying to differentiate the editions or even interpreting the false positives, derived from aspects such as the algorithms of automatic suggestion of works.
Downloads
References
Bensamoun, Alexandra (2014). "The French out-of-commerce books law in the light of the European orphan works directive". Queen Mary journal of intellectual property, v. 4, n. 3, pp. 213-225. https://doi.org/10.4337/qmjip.2014.03.03
Comisión Europea (2005). Comunicación de la Comisión al Parlamento Europeo, al Consejo, al Comité Económico y Social Europeo y al Comité de las Regiones: I2010: Bibliotecas Digitales: [Sec(2005) 1194] [Sec(2005) 1195]. https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=celex:52005DC0465
Comisión Europea (2006). "Recomendación de la Comisión 24 de agosto de 2006 sobre la digitalización y la accesibilidad en línea del material cultural y la conservación digital (2006/585/CE)". Diario oficial, n. L 236/28 de 31/08/2006, pp. 1279-1281. https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=celex%3A32006H0585
Comisión Europea (2008). Comunicación de la Comisión al Consejo, al Parlamento Europeo, al Comité Económico y Social Europeo y al Comité de las Regiones - El patrimonio cultural europeo a un clic del ratón: avances en la digitalización y el acceso en línea al material cultural y en la conservación digital en la UE [Sec(2008) 2372]. https://eur-lex.europa.eu/legal-content/ES/ALL/?uri=CELEX%3A52008DC0513
Comisión Europea (2016). Propuesta de Directiva del Parlamento Europeo y del Consejo sobre los derechos de autor en el mercado único digital. https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=CELEX%3A52016PC0593
Curto-Polo, Mercedes (2017). "El destino de los libros olvidados". European papers, v. 2, n. 2, pp. 731-741. https://doi.org/10.15166/2499-8249/156
Díaz-Noci, Javier; Tous-Rovirosa, Anna (2012). "La audiencia como autor: narrativas transmedia y propiedad intelectual del público. Algunas reflexiones jurídicas". El profesional de la información, v. 21, n. 5, pp. 458-467. https://doi.org/10.3145/epi.2012.sep.03
Evangelio-Llorca, Raquel (2018). "Estrategias de la Unión Europea para facilitar el uso de obras fuera del circuito comercial por instituciones de patrimonio cultural en el mercado único digital". PEI. Revista de propiedad intelectual, n. 60, pp. 13-66. https://www.pei-revista.com/numeros-publicados/numero-60-septiembre-diciembre-2-018
Iglesias-Rebollo, César (2012). "Derecho e información". El profesional de la información, v. 21, n. 5, pp. 449-452. https://doi.org/10.3145/epi.2012.sep.01
Janssens, Marie-Christine; Tryggvadóttir, Ran (2014). "Facilitating access to orphan and out of commerce works to make Europe´s cultural resources available to the broader public". SSRN papers, 15 December, pp. 12-16. https://doi.org/10.2139/ssrn.2538097
Millán, José-Antonio (2015). "Edición y difusión del libro". El profesional de la información, v. 24, n. 6, pp. 699-703. https://doi.org/10.3145/epi.2015.nov.01
Parlamento Europeo (2012). "Directiva 2012/28/UE del Parlamento Europeo y del Consejo, de 25 de octubre de 2012, sobre ciertos usos autorizados de las obras huérfanas (Texto pertinente a efectos del EEE)". Diario oficial, n. L299/5 de 27/10/2012, pp. 253-260. https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=celex:32012L0028
Pautasso, Cesare (2013). "RESTful web services: Principles, patterns, emerging technologies". In: Bouguettaya, Athman; Sheng, Quan; Daniel, Florian. Web services foundations. New York: Springer, pp. 31-51. ISBN: 978 1 4614 7517 0 https://doi.org/10.1007/978-1-4614-7518-7_2
Pfleeger, Shari-Lawrence; Atlee, Joanne (2010). Software engineering: theory and practice. Pearson, pp. 48-57. ISBN: 978 0 136061694
Pressman, Roger (2005). Software engineering: A practitioner´s approach. McGraw-Hill, pp. 35-36. ISBN: 978 0 073655789 https://doi.org/10.1002/0471028959.sof529
Ramos-Simón, Luis-Fernando; Blázquez-Ochando, Manuel (2018a). "Soluciones para el acceso en línea de obras con derechos de autor pertenecientes a las colecciones de las instituciones documentales y de patrimonio cultural". Revista general de información y documentación, v. 28, n. 2, pp. 525-549. https://doi.org/10.5209/RGID.62838
Ramos-Simón, Luis-Fernando; Blázquez-Ochando, Manuel (2018b). "Patrimonio digital: Obras renacidas, una nueva vida para las obras fuera del circuido comercial". Scire, v. 24, n. 2, pp. 13-23. https://www.ibersid.eu/ojs/index.php/scire/article/view/4591
Ricci, Francesco; Rokach, Lior; Shapira, Bracha (2015). "Recommender systems: Introduction and challenges". In: Ricci, Francesco; Rokach, Lior; Shapira, Bracha. Recommender systems handbook. Boston: Springer, pp. 1-34. ISBN: 978 1 4899763761 https://doi.org/10.1007/978-1-4899-7637-6_1
Rodríguez, Alex (2015). "Restful web services: The basics". IBM developerWorks, n. 33. https://developer.ibm.com/articles/ws-restful
Tallova, Lydie (2014). "Copyright aspects of disclosure of works within the Europeana Digital Library". In: Sgem2014 Conference on political sciences, law, finance, economics and tourism, pp. 561-568. https://doi.org/10.5593/sgemsocial2014/B21/S5.074
Ward, Jacob (2013). Instant PHP web scraping. Packt Publishing. ISBN: 978 1 782164760
Widenius, Michael; Axmark, David; Arno, Kaj (2002). "MySQL full-text search". In: Widenius, Michael; Axmark, David; Arno, Kaj. MySQL reference manual: documentation from the source. O´Reilly. ISBN: 978 0 596002653 https://learning.oreilly.com/library/view/mysql-reference-manual/0596002653/ch06s08.html
Zandstra, Matt (2013). "A simple parser". In: Zandstra, Matt. PHP objects, patterns, and practice. Berkeley: Apress, pp. 467-488. ISBN: 978 1 430260318 https://doi.org/10.1007/978-1-4302-6032-5_23
Downloads
Additional Files
- Interfaz del programa (Español (España))
- Funcionamiento del programa (Español (España))
- Relación de frases destacadas (Español (España))
- Información de los autores (Español (España))
- Fotografía autor 1 (Español (España))
- Fotografía autor 2 (Español (España))
- Informe de resultados obtenido por el programa OCW durante su prueba de fiabilidad (Español (España))
- Archivo de instalación de las tablas de la base de datos del programa OCW (Español (España))
- Programa OCW Test - Versión 1 (Español (España))
- Muestra de libros de 1947 - Set de datos (identificadores) (Español (España))
- Muestra de libros de 1967 - Set de datos (identificadores) (Español (España))
- Muestra de libros de 1987 - Set de datos (identificadores) (Español (España))
- Muestra de libros más prestados - Set de datos (identificadores) (Español (España))
Published
How to Cite
Issue
Section
License
Dissemination conditions of the articles once they are published
Authors can freely disseminate their articles on websites, social networks and repositories
However, the following conditions must be respected:
- Only the editorial version should be made public. Please do not publish preprints, postprints or proofs.
- Along with this copy, a specific mention of the publication in which the text has appeared must be included, also adding a clickable link to the URL: http://www.profesionaldelainformacion.com
- Only the final editorial version should be made public. Please do not publish preprints, postprints or proofs.
- Along with that copy, a specific mention of the publication in which the text has appeared must be included, also adding a clickable link to the URL: http://revista.profesionaldelainformacion.com
Profesional de la información journal offers the articles in open access with a Creative Commons BY license.