053.3 Lección 1
Certificación: |
Open Source Essentials |
Versión: |
1.0 |
Tema: |
053 Licencias de contenido abierto |
Objectivo: |
053.3 Otras licencias de contenido abierto |
Lección: |
1 de 1 |
Introducción
En lecciones anteriores ya se ha introducido el concepto de contenido abierto, centrándose en las licencias Creative Commons. Sin embargo, además de esas licencias, existen otras de contenido abierto, algunas de las cuales se relacionan con contenido específico y también se utilizan regularmente para “subproductos” (como documentación) de proyectos de código abierto.
Licencias para documentación (software)
Los grandes repositorios de software contienen periódicamente documentación o manuales del software además del código. La documentación suele contener varios elementos protegidos por derechos de autor, como textos explicativos, gráficos ilustrativos o ejemplos de código. Las licencias de código abierto que se aplican al contenido de un repositorio, generalmente si emplean a dichos textos no hay otra información disponible; por ejemplo, GPLv3.0 se aplica a “cualquier trabajo sujeto a derechos de autor” y no se limita al código.
Sin embargo, la documentación suele estar sujeta a diferentes condiciones de licencia. Esto puede tener sentido por varias razones, porque la documentación se produce y utiliza de manera diferente al código. Las condiciones de licencia de una licencia copyleft estricta para programas de ordenador pueden impedir la adopción de partes individuales de la documentación para otros programas. Tampoco está claro qué se entiende por proporcionar el “código fuente” para la documentación con licencia GPLv3.0. Además, solía ser una práctica común distribuir versiones impresas de documentación o manuales de programas. Esta circunstancia se puede tener mejor en cuenta mediante licencias de documentación específicas (por ejemplo, si algunas obligaciones de licencia están vinculadas a un cierto número de copias distribuidas).
Las licencias Creative Commons se suelen utilizar para la documentación, pero también existen licencias copyleft especiales para la documentación, como la Free Documentation License (FDL), que explica su finalidad en su preámbulo:
El propósito de esta Licencia es hacer que un manual, libro de texto u otro documento funcional y útil sea “libre” en el sentido de libertad: asegurar a todos la libertad efectiva de copiar y redistribuir, con o sin modificarlo, ya sea comercial o no comercialmente. En segundo lugar, esta Licencia preserva para el autor y el editor una forma de obtener crédito por su trabajo, sin ser considerado responsable por las modificaciones realizadas por otros.
Esta Licencia es una especie de “copyleft”, lo que significa que los trabajos derivados del documento deben ser libres en el mismo sentido. Complementa la Licencia Pública General GNU, que es una licencia copyleft diseñada para software libre.
Hemos diseñado esta Licencia para utilizarla en manuales de software libre, porque el software necesita documentación: un programa libre debe venir con manuales que proporcionen las mismas libertades que el software. Pero esta Licencia no se limita a los manuales de software; se puede utilizar para cualquier trabajo textual, independientemente del tema o de si se publica como libro impreso. Recomendamos esta Licencia principalmente para trabajos cuyo propósito sea instrucción o referencia.
Preámbulo
La licencia es muy específica en cuanto a documentación; por ejemplo, también aborda las versiones impresas. En particular, una licencia de documentación copyleft no afecta explícitamente al código con el que se entrega. Aunque también sería posible distribuir documentación bajo GPLv3.0 junto con código con licencia MIT: Dado que en este caso serían dos trabajos independientes, la GPLv3.0 de la documentación no supondría que el código tuviera que tener licencia GPLv3.0. Pero una licencia dedicada a la documentación proporciona más claridad a este respecto.
Licencias para Bases de Datos
También existen licencias especiales para bases de datos. Estas licencias tienen en cuenta, entre otras cosas, el uso de una base de datos como recurso para un programa y las particularidades de la protección de derechos de autor de las bases de datos.
A qué se aplica el término “Base de datos”
En la legislación sobre derechos de autor, en algunos ordenamientos jurídicos (incluido el europeo) se hace una distinción entre obras de bases de datos que, al igual que otras obras protegidas por derechos de autor (imágenes, textos, etc.), gozan de protección sobre la base de la creación intelectual personal (selección y disposición de elementos), y bases de datos para cuya producción (adquisición, verificación, presentación) se requirió una inversión sustancial (derecho de base de datos).
En ambos casos, el objeto de protección es una colección de elementos independientes (como obras o datos distintos) que están ordenados sistemática o metódicamente y son accesibles individualmente por vía electrónica o por otros medios. La protección de los derechos de autor de los elementos en sí no es importante, por lo que también pueden ser meros valores numéricos.
Por lo tanto, una colección de datos puede protegerse mediante derechos de autor como una obra de base de datos o bajo un derecho de base de datos (en la UE). Para que una obra de base de datos esté protegida, la disposición y selección de los elementos debe expresar una creación intelectual personal. Es poco probable que este sea el caso de las recopilaciones de datos que se utilizan como base para el software, pero pueden protegerse bajo el derecho de base de datos. Para ganar este derecho se debe haber realizado una inversión sustancial en la recolección y disposición de los elementos. Esta inversión también puede consistir en tiempo y recursos humanos.
Actualmente hay disponibles varias licencias para bases de datos y colecciones de datos que cubren mejor el uso de información que las licencias de software de código abierto “clásicas”. Echemos un vistazo a la distinción usando un ejemplo.
Como parte de un proyecto de investigación académica, todos los poemas de un autor deben recopilarse y publicarse en un sitio web, donde están ordenados alfabéticamente por título y se puede acceder a ellos individualmente. Sin embargo, el proyecto requiere que los derechos de autor pertinentes para la distribución y reproducción de los poemas se obtengan del autor. Para ello se pagan derechos de licencia.
Los derechos de licencia pueden constituir una “inversión sustancial”. Dado que los poemas se pueden recuperar individualmente y están ordenados sistemáticamente (según el alfabeto), la base de datos que contiene los poemas se puede proteger bajo el derecho de base de datos. Sin embargo, los elementos (poemas) no fueron seleccionados específicamente (la selección se hizo basándose en su integridad) y la disposición no es creativa, sino puramente sistemática. Por lo tanto, no existe ninguna creación intelectual personal en relación con la base de datos, por lo que la base de datos no se considera una obra de base de datos.
Si, por el contrario, los poemas hubieran sido ordenados y seleccionados según ciertos criterios — por ejemplo, para documentar ciertos motivos de la obra del autor en el contexto del período creativo — podría existir una creación intelectual personal, y entonces esta colección de poemas se podría proteger como trabajo de base de datos.
Sin embargo, las dos categorías reciben un trato diferente según la ley de derechos de autor, en particular con respecto al plazo de protección: las bases de datos bajo el derecho de base de datos están protegidas sólo 15 años después de su producción/publicación, a diferencia de 70 años después de la muerte del autor para las obras de bases de datos.
Delimitación de datos
Los datos contenidos (en nuestro ejemplo, los poemas) siempre deben considerarse por separado de la base de datos en su conjunto, porque pueden (pero no necesariamente) ser elegibles para protección por derecho propio y, por lo tanto, pueden estar sujetos a diferentes condiciones de licencia. Por ejemplo, la colección de poemas puede estar sujeta a la Licencia de base de datos abierta (ver más abajo), mientras que los poemas individuales pueden estar sujetos a una licencia Creative Commons o una licencia de propiedad.
Delimitación para el Sistema de Gestión de Bases de Datos (DBMS)
Además, el software para gestionar los datos, el llamado sistema de gestión de bases de datos (DBMS), que no se considera parte de la base de datos según la ley de derechos de autor, sino un medio para acceder a los datos, debe considerarse por separado según la ley de derechos de autor. Estas aplicaciones, como MySQL, PostgreSQL, MariaDB y otras, deben considerarse por separado como programas informáticos y, como tales, se pueden proteger.
Conjuntos de datos para entrenar modelos de aprendizaje automático
Se pueden descargar varias colecciones de datos de sitios web como huggingface.co o kaggle.com, por ejemplo para entrenar modelos de aprendizaje automático. Estas colecciones, también conocidas como conjuntos de datos, suelen estar sujetas al derecho de base de datos, siempre que se haya realizado una “inversión sustancial” en su producción (lo que normalmente no es evidente desde el exterior).
El término “conjunto de datos” es algo vago porque puede referirse a una línea en una base de datos (es decir, una entrada o un elemento definible) pero también a colecciones de datos o conjuntos de datos.
Licencia de base de datos abierta (ODbL)
Estas distinciones también son visibles en la Open Database License (ODbL), una licencia ampliamente utilizada en el sector de las bases de datos. El ODbL fue desarrollado por Open Data Commons, un proyecto de Open Knowledge Foundation. La licencia distingue claramente en su preámbulo entre protección de la base de datos y protección del contenido individual de la base de datos. La licencia se refiere únicamente a lo primero, mientras que los contenidos también pueden licenciarse en otros lugares independientemente de esto.
Por supuesto, todavía es posible elegir la misma licencia para la base de datos y el contenido, por ejemplo, compilar una colección de obras bajo licencia CC-BY-4.0 en una base de datos que a su vez tenga licencia bajo CC-BY-4.0.
La mejor licencia para la base de datos depende de los objetivos del productor de la base de datos. Siguiendo con nuestro ejemplo de la colección de poesía: si la base de datos de poesía debe modificarse a voluntad y también puede distribuirse bajo otras condiciones de licencia, el ODbL no sería la elección correcta. Esto se debe a que el ODbL contiene un copyleft para bases de datos, lo que significa que una base de datos derivada de una base de datos con licencia ODbL (por ejemplo, una base de datos que adopta todos los elementos y la disposición de los elementos de la base de datos original y agrega otros) puede redistribuirse sólo bajo las mismas condiciones. En este caso, una licencia Creative Commons con derechos de edición (por ejemplo, CC-BY) es una mejor opción.
La ODbL también deja claro que de ninguna manera se aplica a los programas informáticos que gestionan la base de datos (es decir, un DBMS): “Esta licencia no se aplica a los programas informáticos utilizados en la creación u operación de la base de datos.”
Sin embargo, la licencia estipula que una obra creada a partir del contenido de la base de datos y disponible para uso público (la llamada obra producida) debe al menos indicar qué base de datos (no DBMS) se utilizó para ella y que la base de datos en sí puede ser utilizado según las condiciones de la ODbL. Un ejemplo de tal trabajo producido es un mapa de calles creado a partir de las coordenadas recopiladas en la base de datos.
Si para una base de datos se utilizara una de las licencias copyleft conocidas (específicas del software), como por ejemplo GPLv3.0, se puede suponer que un programa informático que utilice la base de datos (por ejemplo, para un sistema de tienda) sólo podría distribuirse bajo los términos de GPLv3.0. Por otra parte, es probable que la licencia de un DBMS sea independiente de la licencia de la base de datos porque el DBMS no se considera un “trabajo derivado” de esta; simplemente permite el acceso y la edición y, por tanto, es una obra independiente.
Acuerdos de licencia de datos comunitarios (CDLA)
Los Acuerdos de licencia de datos comunitarios (CDLA), un proyecto de la Fundación Linux, también se centra en la concesión de licencias de datos (a diferencia del software). Las recopilaciones de datos de capacitación para sistemas de aprendizaje automático también pueden ser objeto de CDLA.
Nuestras comunidades querían desarrollar acuerdos de licencia de datos que pudieran permitir el intercambio de datos similar a lo que tenemos con el software de código abierto. El resultado es una colaboración a gran escala sobre licencias para compartir datos bajo un marco legal que llamamos Acuerdo de Licencia de Datos Comunitarios (CDLA).
Estas licencias establecen el marco para el intercambio colaborativo de datos que hemos visto que funciona en comunidades de software de código abierto.
Por lo tanto, la CDLA se basa en un marco que tiene en cuenta diferentes niveles de cuestiones de licencia, especialmente cuando los datos se compilan de múltiples fuentes por diferentes contribuyentes. En nuestro ejemplo, podría ser una colección en la que diferentes autores aportan sus propios poemas para crear una base de datos de poesía común.
CDLA distingue entre la “licencia entrante” para los datos que se agregan a la colección y la “licencia saliente” para el uso de los datos. En un tercer nivel, especifica los requisitos para la organización que aloja o conserva los datos.
Siguiendo con el ejemplo de la poesía: un autor que aporta su poema se guiará por las especificaciones de “licencias entrantes”. La “licencia de salida” se refiere a las condiciones acordadas por los editores de la colección de poesía en su conjunto.
Al igual que las licencias de software de código abierto, las CDLA están disponibles en las categorías permisiva y compartida, que presentaremos brevemente. Una visita a los sitios web kaggle.com o huggingface.co antes mencionados le dará una idea de qué licencias se utilizan para bases de datos o conjuntos de datos: por ejemplo, puede usar filtros para descubrir qué colecciones de datos se ofrecen bajo CDLA.
Acuerdo de licencia de datos comunitarios: permisivo
La versión 2.0 de la permisiva CDLA está disponible desde 2021 y es mucho más concisa y claramente formulada que la versión 1.0.
La versión 1.0 otorga derechos para usar y publicar los datos bajo licencia, incluida la publicación de los llamados “datos mejorados”, que también incluyen ediciones o adiciones al conjunto de datos. Al transmitir o publicar los datos se deben respetar las obligaciones básicas de licencia; entre otras cosas, se debe transmitir el texto de la licencia, se deben marcar los cambios y se deben conservar los avisos de derechos de autor. Los datos también se pueden transmitir bajo condiciones de licencia adicionales o de otro tipo.
En la versión 2.0, la expresión “datos mejorados” ya no se utiliza; en cambio, la concesión de derechos se formula de manera más precisa:
Un Destinatario de datos puede usar, modificar y compartir los Datos puestos a disposición por los Proveedores de datos en virtud de este acuerdo si ese Destinatario de datos sigue los términos de este acuerdo.
versión 2.0
La única condición para compartir los datos en la versión 2.0 es la transmisión del texto de la licencia o un enlace al texto de la licencia.
Acuerdo de licencia de datos comunitarios: compartir
La versión compartida de CDLA, que actualmente sólo está disponible en la versión 1.0, contiene un copyleft para los datos de tal manera que la transferencia (“publicación”) de “datos mejorados” sólo se permite bajo las mismas condiciones.
Los datos (incluidos los datos mejorados) deben publicarse en virtud de este Acuerdo de conformidad con esta Sección 3;
versión 1.0
Acceso abierto
Un término que se utiliza a menudo en relación con el contenido abierto es acceso abierto. Aunque el término no está definido en el sentido legal, la declaración de la Iniciativa de Acceso Abierto de Budapest (BOAI) deja clara la intención detrás del acceso abierto. La iniciativa surgió de una conferencia en Budapest en 2001 y resume los esfuerzos internacionales por el acceso abierto:
La literatura que debería ser de libre acceso en línea es aquella que los académicos dan al mundo sin expectativa de pago. Principalmente, esta categoría abarca sus artículos de revistas revisados por pares, pero también incluye cualquier preimpresión no revisada que deseen publicar en línea para comentar o alertar a sus colegas sobre hallazgos de investigación importantes. Hay muchos grados y tipos de acceso más amplio y más fácil a esta literatura. Por “acceso abierto” a esta literatura nos referimos a su libre disponibilidad en la Internet pública, lo que permite a cualquier usuario leer, descargar, copiar, distribuir, imprimir, buscar o vincular los textos completos de estos artículos, rastrearlos para indexarlos, pasarlos como datos a un software o utilizarlos para cualquier otro fin lícito, sin barreras financieras, legales o técnicas distintas de las inseparables del acceso a Internet. La única limitación a la reproducción y distribución, y el único papel del derecho de autor en este ámbito, debería ser dar a los autores control sobre la integridad de su trabajo y el derecho a ser reconocidos y citados adecuadamente.
Por tanto, el acceso abierto se refiere en particular al acceso gratuito a la literatura científica y otros contenidos en Internet. El movimiento de acceso abierto se originó en la década de 1990 con el objetivo de poner las publicaciones científicas a disposición del público en general. Por lo tanto, el acceso abierto no se refiere a una licencia específica o a determinadas condiciones de concesión de licencia, sino más bien a un concepto de concesión de licencia.
Cuando un artículo se publica en acceso abierto, el primer paso es elegir una licencia de contenido abierto, como por ejemplo una de las licencias Creative Commons. Sin embargo, la elección de una licencia CC no es obligatoria para el acceso abierto. A lo largo de los años, se ha desarrollado una categorización de diferentes estrategias de acceso abierto, que también tienen en cuenta la doble licencia: por ejemplo, otorgar una licencia completa a un editor y al mismo tiempo el autor ofrece el contenido para descargar en su propio sitio web.
Tanto la BOAI como la Declaración de Berlín que siguió dos años después son hitos importantes en el movimiento de acceso abierto. El preámbulo de la Declaración de Berlín establece:
De acuerdo con el espíritu de la Declaración de la Iniciativa de Acceso Abierto de Budapest, la Carta de ECHO y la Declaración de Bethesda sobre Publicaciones de Acceso Abierto, hemos redactado la Declaración de Berlín para promover Internet como un instrumento funcional para una base mundial de conocimientos científicos y una reflexión humana y especificar medidas que los responsables de las políticas de investigación, las instituciones de investigación, las agencias de financiación, las bibliotecas, los archivos y los museos deben considerar.
Ejercicios guiados
-
¿Se pueden utilizar también las licencias de código abierto “clásicas” para documentación y bases de datos?
Sí
No
Depende, no hay una respuesta clara
-
¿Tiene sentido utilizar licencias independientes para la documentación? ¿Por qué?
-
¿Tiene sentido utilizar licencias independientes para bases de datos? ¿Por qué?
-
¿Cuáles de las siguientes licencias son adecuadas para la documentación?
CC-BY-4.0
FDL
ODbL
GPL-3.0
BSD-3-Clause
-
¿Qué se entiende por el término “acceso abierto”?
Ejercicios exploratorios
¿Existen licencias específicas para fuentes?
+
-
Explique brevemente dos estrategias o modelos de acceso abierto.
-
¿Qué se entiende por “definición abierta”?
Resumen
Además de las conocidas licencias Creative Commons, existen otros conceptos de licencia de contenidos que se adaptan aún más específicamente a los respectivos tipos de datos: para documentación de software o bases de datos, están disponibles las licencias FDL u ODbL que tienen en cuenta las características de este tipo de obras. Esta lección proporciona una descripción general de algunas de estas licencias y también aborda el concepto de acceso abierto.
Respuestas a ejercicios guiados
-
¿Se pueden utilizar también las licencias de código abierto “clásicas” para documentación y bases de datos?
Sí
X
No
Depende, no hay una respuesta clara
-
¿Tiene sentido utilizar licencias independientes para la documentación? ¿Por qué?
Sí, porque suelen contener otros contenidos además del propio programa. También regulan cómo se deben procesar, por ejemplo, las impresiones de la documentación.
-
¿Tiene sentido utilizar licencias independientes para bases de datos? ¿Por qué?
Sí, puede resultar útil. En particular, una licencia de base de datos específica puede lograr un efecto copyleft para la base de datos sin que el copyleft afecte el código circundante. Además, las licencias de bases de datos abordan disposiciones específicas que la ley de derechos de autor establece para la protección de las bases de datos.
-
¿Cuáles de las siguientes licencias son adecuadas para la documentación?
CC-BY-4.0
X
FDL
ODbL
GPL-3.0
BSD-3-Clause
-
¿Qué se entiende por el término “acceso abierto”?
El término describe el acceso libre a literatura científica y otros contenidos en Internet.
Respuestas a ejercicios exploratorios
-
¿Existen licencias específicas para fuentes?
Sí, existe, por ejemplo, la licencia SIL Open Font License (OFL), que contiene un copyleft específico para las fuentes, pero esto no tiene ningún efecto si las fuentes se utilizan sin cambios.
-
Explique brevemente dos estrategias o modelos de acceso abierto.
En la estrategia de acceso abierto “Gold”, el editor pone a disposición la publicación directamente bajo una licencia de contenido abierto, generalmente (pero no exclusivamente) utilizando licencias Creative Commons.
El modelo de acceso abierto “verde” se aplica cuando el editor no distribuye la publicación en acceso abierto, pero el autor tiene la oportunidad de hacer que la publicación esté disponible para su descarga, por ejemplo, en su sitio web bajo una licencia abierta.
-
¿Qué se entiende por “definición abierta”?
La “definición abierta” es una comprensión común, formulada por la Open Knowledge Foundation, del término “abierto” en “datos abiertos”, “conocimiento abierto” y “contenido abierto”. " La definición describe en particular las libertades básicas que deben concederse para que una licencia sea “abierta” en el sentido de la definición. Estos incluyen acceso, uso, edición o modificación y uso compartido.