053.3 Lição 1
Certificação: |
Open Source Essentials |
---|---|
Versão: |
1.0 |
Tópico: |
053 Licenças de conteúdo aberto |
Objetivo: |
053.3 Outras licenças de conteúdo aberto |
Lição: |
1 de 1 |
Introdução
As lições anteriores já apresentaram o conceito de conteúdo aberto, com foco nas licenças Creative Commons. Mas além do Creative Commons, existem outras licenças de conteúdo aberto, algumas das quais voltadas a conteúdos específicos e também regularmente utilizadas para “subprodutos” (como documentação) de projetos de código aberto.
Licenças para documentação (de software)
Os grandes repositórios de software costumam incluir a documentação ou os manuais do software, além do código. A documentação geralmente contém vários elementos protegidos por direitos autorais, como textos explicativos, gráficos ilustrativos ou exemplos de código. As licenças de código aberto que se aplicam ao conteúdo de um repositório geralmente também são aplicáveis a esses textos se não houver outra informação disponível; por exemplo, a GPLv3.0 se aplica a “qualquer obra protegida por direitos autorais” e não se limita ao código.
No entanto, a documentação está frequentemente sujeita a diferentes condições de licenciamento. Isso pode fazer sentido por diversos motivos, já que a documentação é produzida e usada de forma diferente do código. As condições de uma licença copyleft estrita para programas de computador podem, por exemplo, impedir a adoção de trechos individuais da documentação em outros programas. Também não está claro o que exatamente significa dizer que o “código-fonte” deve ser fornecido para uma documentação licenciada pela GPLv3.0. Além disso, antigamente era comum distribuir versões impressas da documentação ou manuais de programas. Esta circunstância pode ser tratada com mais clareza empregando-se licenças específicas para a documentação (por exemplo, se algumas obrigações de licença estiverem ligadas a um determinado número de cópias distribuídas).
As licenças Creative Commons são frequentemente usadas para a documentação, mas também existem licenças copyleft dedicadas, como a Free Documentation License (FDL), que explica sua finalidade em seu preâmbulo:
O objetivo desta Licença é tornar um manual, livro didático ou outro documento funcional e útil “livre” no sentido de liberdade: garantir a todos a liberdade efetiva de copiar e redistribuir esse material, com ou sem modificações, seja comercialmente ou não comercialmente. Em segundo lugar, esta Licença preserva, para o autor e o editor, uma forma de obter crédito por seu trabalho, sem que eles sejam considerados responsáveis pelas modificações feitas por terceiros.
Essa Licença é uma espécie de “copyleft”, o que significa que os trabalhos derivados do documento devem ser livres no mesmo sentido. Ela complementa a Licença Pública Geral GNU, que é uma licença copyleft criada para o software livre.
Projetamos esta Licença para usá-la em manuais de software livre, porque o software livre precisa de documentação livre: um programa livre deve vir com manuais que proporcionem as mesmas liberdades que o software oferece. Mas esta Licença não se limita a manuais de software; ela pode ser utilizada para qualquer obra textual, independentemente do assunto ou de sua publicação em formato impresso. Recomendamos esta Licença principalmente para trabalhos cujo objetivo seja instrução ou referência.
Preamble
A licença é bem específica para documentação; ela também engloba, por exemplo, as versões impressas. É importante lembrar que uma licença copyleft de documentação não afeta o código com o qual ela é entregue. Embora também seja possível distribuir a documentação sob a GPLv3.0 juntamente com um código licenciado pelo MIT: como neste caso se tratam de dois trabalhos independentes, a GPLv3.0 da documentação não resultaria na necessidade de o código ser licenciado sob GPLv3.0. Mas uma licença dedicada para a documentação proporciona mais clareza a esse respeito.
Licenças para bancos de dados
Existem também licenças especiais para os bancos de dados. Entre outras coisas, esssas licenças levam em conta a utilização de um banco de dados como recurso em um programa e as características especiais de proteção de direitos autorais para bancos de dados.
A que se aplica o termo “Banco de Dados”
Na legislação de direitos autorais de alguns sistemas jurídicos, incluindo na Europa, é feita uma distinção entre obras do tipo bancos de dados que, a exemplo de outras obras protegidas por direitos autorais (imagens, textos etc.), gozam de proteção com base na criação intelectual pessoal (seleção e organização de elementos) e bancos de dados para cuja produção (aquisição, verificação, apresentação) foi necessário um investimento substancial (lei de bancos de dados).
Em ambos os casos, o objeto da proteção é um conjunto de elementos independentes (tais como obras ou itens de dados distintos) que são organizados de forma sistemática ou metódica e acessíveis individualmente por meio eletrônico ou por outros meios. A propriedade dos direitos autorais dos elementos em si não é importante, portanto eles também podem ser meros valores numéricos.
Uma coleção de dados pode, assim, ser protegida por direitos autorais como uma obra do tipo banco de dados ou pela lei de bancos de dados (na UE). Para que uma obra do tipo banco de dados seja protegida, a disposição e seleção dos elementos deve expressar uma criação intelectual pessoal. É pouco provável que esse seja o caso das coletas de dados utilizadas como base para um software — mas estas podem ser protegidas pela lei de bancos de dados. Para conquistar esse direito, deve ter sido feito um investimento substancial na coleta e disposição dos elementos. Esse investimento também pode consistir em tempo e recursos humanos.
Atualmente existem diversas licenças para bancos de dados e coleções de dados que cobrem melhor o uso de dados do que as licenças de software de código aberto “clássicas”. Para entender melhor, vamos usar um exemplo.
Como parte de um projeto de pesquisa acadêmica, todos os poemas de um autor devem ser coletados e publicados em um site, onde são classificados em ordem alfabética por título e podem ser acessados individualmente. No entanto, o projeto exige que os direitos autorais relevantes para a distribuição e reprodução dos poemas sejam obtidos do autor. Para isso, é necessário o pagamento de taxas de licenciamento.
As taxas de licenciamento podem constituir um “investimento substancial.” Como os poemas poderão ser recuperados individualmente e estarão organizados de forma sistemática (de acordo com o alfabeto), o banco de dados que os reúne pode ser protegido pela lei de bancos de dados. Contudo, os elementos (poemas) não foram especificamente selecionados (a seleção foi feita com base na completude da obra) e o arranjo não é criativo, mas puramente sistemático. Portanto, não há criação intelectual pessoal em relação ao banco de dados, de modo que o banco de dados não se qualifica como uma obra do tipo banco de dados.
Se, por outro lado, os poemas tivessem sido organizados e selecionados de acordo com certos critérios — por exemplo, para documentar determinados motivos na obra do autor no contexto de um período criativo dado — poderia existir uma criação intelectual pessoal, e nesse caso esta coleção de poemas seria protegida como uma obra do tipo banco de dados.
Todavia, as duas categorias são tratadas de forma diferente pela lei dos direitos autorais, em particular no que diz respeito ao prazo de proteção: os bancos de dados sujeitos à lei de bancos de dados são protegidos por apenas 15 anos após a produção/publicação, bem menos que os 70 anos após a morte do autor aplicáveis às obras do tipo de dados.
Delimitação dos dados
Os dados contidos no banco (no nosso exemplo, os poemas) devem sempre ser considerados separadamente do banco de dados em si, porque eles podem (mas não necessariamente) ter direito à proteção por si sós, estando, assim, sujeitos a diferentes condições de licenciamento. Por exemplo, a coleção de poemas pode estar sujeita à Open Database License (veja abaixo), ao passo que os poemas individuais podem estar sob uma licença Creative Commons ou uma licença proprietária.
Delimitação dos sistemas de gerenciamento de banco de dados (SGBD)
Além disso, o software para gerir os dados, o chamado sistema de gerenciamento de banco de dados (SGBD) — que não é considerado parte do banco de dados protegido pela lei de direitos autorais, mas como um meio de acesso aos dados — recebe uma proteção distinta pela lei dos direitos autorais. Esses programas — como MySQL, PostgreSQL, MariaDB e outros — são considerados separadamente como programas de computador e protegidos como tal.
Conjuntos de dados para treinamento de modelos de aprendizado de máquina
Diversas coleções de dados podem ser baixadas de sites como huggingface.co ou kaggle.com para, por exemplo, treinar modelos de aprendizado de máquina. Essas coleções, também conhecidas como datasets, estão geralmente sujeitas à lei de bancos de dados, desde que um “investimento substancial” tenha sido feito em sua produção (o que em geral não é facilmente visível do exterior).
O termo “dataset” é um tanto vago porque pode se referir a uma linha em um banco de dados — ou seja, uma entrada ou um elemento definível — mas também a coleções de dados ou conjuntos de dados.
Open Database License (ODbL)
Essas distinções também são visíveis na Open Database License (ODbL), uma licença amplamente utilizada no setor de bancos de dados. A ODbL foi desenvolvida pelo Open Data Commons, um projeto da Open Knowledge Foundation. A licença faz uma distinção clara em seu preâmbulo entre a proteção do banco de dados e a proteção dos conteúdos individuais desse banco. A licença refere-se apenas ao primeiro, embora os conteúdos também possam ser licenciados de forma independente.
É claro que ainda é possível escolher a mesma licença para o banco de dados e seu conteúdo — por exemplo, compilar uma coleção de obras licenciadas sob a CC-BY-4.0 num banco de dados que, por sua vez, é licenciado sob a CC-BY-4.0.
A melhor licença para o banco de dados depende dos objetivos de seu criador. Continuando com nosso exemplo da coleção de poesia: se o banco de dados de poemas puder ser modificado à vontade e também ser distribuído sob outras condições de licenciamento, o ODbL não seria a escolha certa. Isso porque o ODbL contém um copyleft para bancos de dados, ou seja, os bancos de dados derivados de um banco de dados licenciado pelo ODbL (por exemplo, um banco de dados que adote todos os elementos e disposição dos elementos do banco de dados original, adicionando outros) só podem ser redistribuídos sob as mesmas condições. Neste caso, uma licença Creative Commons com direitos de edição (por exemplo, CC-BY) seria uma escolha melhor.
A ODbL também deixa claro que não se aplica de forma alguma a programas de computador que gerenciam bancos de dados (ou seja, um SGBD): “Esta Licença não se aplica aos programas de computador usados na criação ou operação do Banco de Dados.”
No entanto, a licença estipula que uma obra criada a partir do conteúdo do banco de dados e disponível para uso público (uma obra produzida) deve pelo menos indicar qual banco de dados (e não o SGBD) foi usado e que o banco de dados em si pode ser usado sob as condições da ODbL. Um exemplo de obra produzida seria um mapa de ruas criado a partir de coordenadas coletadas no banco de dados.
Se uma das licenças copyleft específicas para software conhecidas, como a GPLv3.0, fosse usada para um banco de dados, seria possível presumir que um programa de computador que usa o banco de dados (por exemplo, para o sistema de uma loja) poderia ser distribuído apenas sob os termos da GPLv3.0. A licença de um SGBD, por outro lado, não dependerá da licença do banco de dados, uma vez que o SGBD não é considerado uma “obra derivada” do banco de dados; ele apenas permite o acesso e edição e é, portanto, uma obra independente.
Community Data License Agreements (CDLA)
Os Community Data License Agreements (CDLA) ou, em português, Contratos de licença de dados comunitários, um projeto da Linux Foundation, também se concentram no licenciamento de dados (distintos de software). As coletas de dados de treinamento para sistemas de aprendizado de máquina também podem ser objeto de CDLAs.
Nossas comunidades desejavam desenvolver contratos de licenciamento de dados que pudessem permitir o compartilhamento de dados semelhante ao que temos com o software de código aberto. O resultado é uma colaboração em larga escala em licenças para o compartilhamento de dados sob um quadro jurídico a que chamamos Contrato de Community Data License Agreement (CDLA)
Essas licenças estabelecem a estrutura para o compartilhamento colaborativo de dados que comprovadamente funciona nas comunidades de software de código aberto.
A CDLA baseia-se, portanto, num quadro que leva em conta diferentes níveis de questões de licenciamento, especialmente quando os dados são compilados a partir de múltiplas fontes por diferentes contribuidores. Por exemplo, uma coleção na qual diferentes autores contribuem com os seus próprios poemas para construir um banco de dados comum de poesia.
A CDLA distingue entre a “licença de entrada”, para os dados que são adicionados à coleção, e a “licença de saída”, que contempla o uso dos dados. Em um terceiro nível, ela especifica requisitos para a organização que hospeda ou mantém os dados.
Para ficar no exemplo da poesia: um autor que contribui com seu poema seria guiado pelas especificações das “licenças de entrada”. A “licença de saída” diria respeito às condições autorizadas pelos editores da coleção de poesia como um todo.
Como no caso das licenças de código aberto para software, as CDLAs estão disponíveis nas categorias permissiva e compartilhamento, que apresentaremos a seguir. Uma visita aos sites kaggle.com ou huggingface.co, acima mencionados, pode dar uma ideia de quais licenças são usadas para bancos de dados ou datasets: usando filtros, é possível descobrir quais coleções de dados são oferecidas sob a CDLA.
Community Data License Agreement — Permissiva
A versão 2.0 da CDLA permissiva está disponível desde 2021 e é muito mais concisa e claramente formulada do que a versão 1.0.
A versão 1.0 concede direitos de uso e publicação dos dados licenciados, incluindo a publicação dos chamados “dados aprimorados”, que contempla edições ou adições ao conjunto de dados. Ao transmitir ou publicar os dados, deverão ser observadas as obrigações básicas da licença; entre outras coisas, o texto da licença deve ser compartilhado, as alterações devem estar assinaladas e os avisos de direitos autorais devem ser mantidos. Os dados também podem ser transmitidos sob condições de licenciamento adicionais ou outras.
Na versão 2.0, a expressão “dados aprimorados” não é mais usada; em vez disso, a concessão de direitos é formulada com mais precisão:
O Destinatário de Dados pode usar, modificar e compartilhar os Dados disponibilizados pelo(s) Provedor(es) de Dados sob este contrato se esse Destinatário de Dados seguir os termos deste contrato.
A única condição para compartilhar os dados na versão 2.0 é a transmissão do texto da licença ou um link para o texto da licença.
Community Data License Agreement — Compartilhamento
A versão de compartilhamento da CDLA, atualmente disponível apenas na versão 1.0, contém um copyleft para dados indicando que a transferência (“publicação”) de “dados aprimorados” é permitida apenas sob as mesmas condições.
Os Dados (incluindo os Dados Aprimorados) devem ser Publicados sob este Contrato de acordo com esta Seção 3.
version 1.0
Acesso aberto
Um termo frequentemente usado em relação ao conteúdo aberto é acesso aberto. Embora não esteja definido no sentido jurídico, a declaração da Iniciativa de Acesso Aberto de Budapeste (BOAI) deixa clara a intenção por trás do acesso aberto. A iniciativa surgiu de uma conferência em Budapeste em 2001 e resume os esforços internacionais para o acesso aberto:
A literatura que deveria ser livremente acessível online é aquela que os acadêmicos dão ao mundo sem expectativa de pagamento. Esta categoria abrange principalmente os artigos de periódicos revisados por pares, mas inclui também quaisquer pré-publicações não revisadas que os autores possam querer publicar online para comentários ou para alertar colegas sobre descobertas importantes de sua pesquisa. Existem muitos graus e tipos para um acesso mais amplo e fácil a esta literatura. Por “acesso aberto” a esta literatura, entendemos a sua disponibilidade gratuita na internet pública, permitindo a qualquer usuário ler, baixar, copiar, distribuir, imprimir, pesquisar ou criar links para os textos completos desses artigos, rastreá-los para indexação, transmiti-los como dados para software ou usá-los para qualquer outra finalidade legal, sem barreiras financeiras, jurídicas ou técnicas além daquelas inseparáveis do acesso à própria internet. A única restrição à reprodução e distribuição, e o único papel dos direitos autorais neste domínio, deveria ser conceder aos autores o controle sobre a integridade do seu trabalho e o direito de serem devidamente reconhecidos e citados.
O acesso aberto refere-se particularmente, portanto, ao acesso gratuito à literatura científica e a outros conteúdos na internet. O movimento de acesso aberto teve origem na década de 1990 com o objetivo de disponibilizar publicações científicas ao público em geral. O acesso aberto não se refere, portanto, a uma licença específica ou a determinadas condições de licenciamento, mas sim a um conceito de licenciamento.
Quando um artigo é publicado com acesso aberto, o primeiro passo é escolher uma licença de conteúdo aberto, como uma das licenças Creative Commons. Todavia, a escolha de uma licença CC não é obrigatória para o acesso aberto. Ao longo dos anos, desenvolveu-se uma categorização de diferentes estratégias de acesso aberto, que também levam em conta o duplo licenciamento — por exemplo, conceder uma licença abrangente a um editor enquanto, simultaneamente, o autor oferece o conteúdo para download em seu próprio site.
Tanto a BOAI como a Declaração de Berlim que se seguiu dois anos depois são marcos importantes no movimento do acesso aberto. O preâmbulo da Declaração de Berlim afirma:
De acordo com o espírito da Declaração da Iniciativa de Acesso Aberto de Budapeste, da Carta ECHO e da Declaração de Bethesda sobre a Publicação em Acesso Aberto, redigimos a Declaração de Berlim para promover a internet como um instrumento funcional para uma base global de conhecimento científico e reflexão humana e especificar medidas que os decisores políticos de pesquisa, instituições de pesquisa, agências de financiamento, bibliotecas, arquivos e museus precisam levar em consideração.
Exercícios Guiados
-
As licenças de código aberto “clássicas” também podem ser usadas para documentação e bancos de dados?
Sim
Não
Depende, não há uma resposta única
-
Faz sentido usar licenças separadas para a documentação? Por quê?
-
Faz sentido usar licenças separadas para bancos de dados? Por quê?
-
Quais das seguintes licenças são adequadas para documentação?
CC-BY-4.0
FDL
ODbL
GPL-3.0
BSD-3-Clause
-
O que significa o termo “acesso aberto”?
Exercícios Exploratórios
-
Existem licenças específicas para fontes?
-
Explique resumidamente duas estratégias ou modelos de acesso aberto.
-
O que se entende por “definição aberta”?
Resumo
Além das conhecidas licenças Creative Commons, existem outros conceitos de licenciamento de conteúdos ainda mais especificamente adaptados a determinados tipos de dados: para documentação de software ou bancos de dados, estão disponíveis as licenças FDL ou ODbL, que levam em consideração as características desses tipos de criação. Esta lição traz uma visão geral de algumas dessas licenças e também aborda o conceito de acesso aberto.
Respostas aos Exercícios Guiados
-
As licenças de código aberto “clássicas” também podem ser usadas para documentação e bancos de dados?
Sim
X
Não
Depende, não há uma resposta única
-
Faz sentido usar licenças separadas para a documentação? Por quê?
Sim, porque geralmente elas abarcam outros conteúdos além do próprio programa. Elas também regulam, por exemplo, como as impressões da documentação devem ser tratadas.
-
Faz sentido usar licenças separadas para bancos de dados? Por quê?
Sim, isso pode ser útil. Em particular, uma licença de banco de dados específica pode atribuir um efeito copyleft ao banco de dados sem que o copyleft afete o código circundante. Além disso, as licenças de bancos de dados abordam as disposições específicas que a lei de direitos autorais prevê para a proteção dos bancos de dados.
-
Quais das seguintes licenças são adequadas para documentação?
CC-BY-4.0
X
FDL
X
ODbL
GPL-3.0
BSD-3-Clause
-
O que significa o termo “acesso aberto”?
O termo descreve o acesso gratuito à literatura científica e outros conteúdos na internet.
Respostas aos exercícios exploratórios
-
Existem licenças específicas para fontes?
Sim, existem. Um exemplo é a SIL Open Font License (OFL), que contém um copyleft específico para fontes, mas ela não tem efeito se as fontes forem usadas inalteradas.
-
Explique resumidamente duas estratégias ou modelos de acesso aberto.
Na estratégia de acesso aberto “Gold” (Ouro), a publicação é disponibilizada diretamente pelo editor sob uma licença de conteúdo aberto, geralmente (mas não exclusivamente) utilizando licenças Creative Commons.
O modelo de acesso aberto “Green” (Verde) se aplica quando o editor não distribui a publicação em acesso aberto, mas o autor tem a oportunidade de disponibilizar a publicação para download em seu site (ou outro lugar) sob uma licença aberta.
-
O que se entende por “definição aberta”?
A “definição aberta” é um entendimento comum, formulado pela Open Knowledge Foundation, do termo “aberto” em “dados abertos”, “conhecimento aberto” e “conteúdo aberto”. A definição descreve, em particular, as liberdades básicas que devem ser concedidas para que uma licença seja “aberta” no sentido da definição. Dentre elas estão o acesso, o uso, a edição ou modificação e o compartilhamento.