Berliner Boersenzeitung - IA generativa recorre a livros para crescer

EUR -
AED 4.313633
AFN 77.713794
ALL 96.524394
AMD 447.271088
ANG 2.102966
AOA 1077.086691
ARS 1704.045282
AUD 1.778098
AWG 2.117175
AZN 2.003403
BAM 1.956986
BBD 2.35973
BDT 143.176779
BGN 1.95654
BHD 0.442867
BIF 3463.566553
BMD 1.174577
BND 1.51406
BOB 8.095907
BRL 6.484367
BSD 1.17156
BTN 105.962223
BWP 15.47372
BYN 3.45955
BYR 23021.707326
BZD 2.356328
CAD 1.618273
CDF 2660.416461
CHF 0.93373
CLF 0.027483
CLP 1078.168041
CNY 8.272839
CNH 8.264658
COP 4540.327024
CRC 583.728946
CUC 1.174577
CUP 31.126288
CVE 110.331872
CZK 24.394847
DJF 208.627567
DKK 7.4715
DOP 73.741555
DZD 152.030597
EGP 55.921486
ERN 17.618654
ETB 182.136914
FJD 2.683027
FKP 0.874948
GBP 0.878601
GEL 3.165445
GGP 0.874948
GHS 13.497181
GIP 0.874948
GMD 86.336511
GNF 10242.772066
GTQ 8.973439
GYD 245.128571
HKD 9.138754
HNL 30.867526
HRK 7.535149
HTG 153.45713
HUF 389.061014
IDR 19644.798726
ILS 3.80385
IMP 0.874948
INR 105.908659
IQD 1534.771417
IRR 49461.433323
ISK 147.996265
JEP 0.874948
JMD 187.465642
JOD 0.832809
JPY 183.043696
KES 151.461476
KGS 102.71622
KHR 4692.664413
KMF 492.147718
KPW 1057.132618
KRW 1735.954093
KWD 0.360442
KYD 0.976359
KZT 602.614719
LAK 25377.408853
LBP 104915.869411
LKR 362.846018
LRD 207.375689
LSL 19.621641
LTL 3.46822
LVL 0.71049
LYD 6.35258
MAD 10.736007
MDL 19.770225
MGA 5292.982732
MKD 61.550646
MMK 2466.869216
MNT 4167.897674
MOP 9.38753
MRU 46.58225
MUR 54.077812
MVR 18.146906
MWK 2031.544828
MXN 21.150138
MYR 4.797018
MZN 75.0635
NAD 19.621724
NGN 1706.953581
NIO 43.114296
NOK 11.984561
NPR 169.533258
NZD 2.037768
OMR 0.451626
PAB 1.17161
PEN 3.946875
PGK 4.981807
PHP 68.7339
PKR 328.278193
PLN 4.212602
PYG 7869.434629
QAR 4.271189
RON 5.092255
RSD 117.381196
RUB 94.552628
RWF 1705.861297
SAR 4.405582
SBD 9.549564
SCR 17.483387
SDG 706.510869
SEK 10.920588
SGD 1.516873
SHP 0.881237
SLE 28.303449
SLL 24630.294701
SOS 668.376647
SRD 45.43031
STD 24311.37046
STN 24.513814
SVC 10.251821
SYP 12987.480461
SZL 19.617055
THB 36.926343
TJS 10.814154
TMT 4.111019
TND 3.419372
TOP 2.8281
TRY 50.18157
TTD 7.947546
TWD 37.027335
TZS 2899.972792
UAH 49.728023
UGX 4176.531372
USD 1.174577
UYU 45.647667
UZS 14183.052891
VES 324.454785
VND 30929.546335
VUV 142.508743
WST 3.278279
XAF 656.326857
XAG 0.017691
XAU 0.000271
XCD 3.174352
XCG 2.111499
XDR 0.81626
XOF 656.326857
XPF 119.331742
YER 279.960019
ZAR 19.684676
ZMK 10572.605087
ZMW 26.858135
ZWL 378.213284
IA generativa recorre a livros para crescer
IA generativa recorre a livros para crescer / foto: Kirill Kudryavtsev - AFP

IA generativa recorre a livros para crescer

Para expandir o negócio dos direitos autorais, o mundo editorial começa a assinar contratos com empresas de tecnologia para permitir que os seus livros alimentem as necessidades crescentes da inteligência artificial generativa.

Tamanho do texto:

A grande editora americana HarperCollins acaba de propor a alguns dos seus autores um contrato com uma sociedade de inteligência artificial para que esta possa usar os seus livros para treinar o seu modelo de IA generativa.

Em um e-mail consultado pela AFP, a empresa tecnológica, cuja identidade é confidencial, propõe 2.500 dólares (14.530 reais) por cada livro selecionado para treinar o seu modelo de linguagem durante um período de três anos.

Para produzir todos os tipos de conteúdo, esta tecnologia precisa ser alimentada continuamente com uma grande quantidade de dados.

Contactada pela AFP, a editora confirmou a operação.

"A HarperCollins fechou um acordo com uma empresa de tecnologia de inteligência artificial para autorizar o uso limitado de determinados títulos (…) para treinar modelos de IA, a fim de melhorar sua qualidade e desempenho", escreveu.

A editora especificou que o acordo "limita claramente a produção de modelos que respeitem os direitos autorais".

A oferta gerou opiniões divergentes no setor e escritores como o americano Daniel Kibblesmith rejeitaram-na categoricamente.

"Provavelmente faria isso por um bilhão de dólares. Faria isso por uma quantia de dinheiro que não me obrigaria a trabalhar mais, porque esse é o objetivo final desta tecnologia", publicou na rede social Bluesky.

- Novos materiais -

A HarperCollins é um dos maiores atores do setor a dar esse passo, mas não o primeiro.

A editora americana de livros científicos Wiley deu acesso "ao conteúdo de livros acadêmicos e profissionais publicados para uso específico na formação desses modelos por 23 milhões de dólares (133 milhões de reais) a uma grande empresa de tecnologia", disse a companhia em março durante a apresentação de seus resultados financeiros.

Este tipo de colaboração evidencia os problemas ligados ao desenvolvimento da inteligência artificial generativa, treinada com enormes quantidades de dados recolhidos na Internet, o que pode resultar em possíveis violações de direitos autorais.

Para Giada Pistilli, chefe de ética da Hugging Face, plataforma franco-americana de IA de acesso livre, o anúncio é um avanço, porque o conteúdo dos livros passa a ser monetizado. Mas lamenta a margem de negociação limitada para os autores.

"O que veremos é um mecanismo de acordos bilaterais entre empresas de novas tecnologias e editoras ou proprietários de direitos autorais, quando na minha opinião seria necessário um diálogo mais amplo para incluir todas as partes envolvidas", afirma.

"Viemos de muito longe", comenta Julien Chouraqui, diretor jurídico do sindicato editorial francês SNE. "É um progresso: o fato de haver um acordo significa que houve um diálogo e uma vontade de alcançar um equilíbrio no uso de dados de origem que estão protegidos por direitos autorais e que vão gerar valor", afirma.

Os editores de imprensa também estão se organizando para enfrentar esse problema. No final de 2023, o jornal americano The New York Times processou a OpenAI, criadora do programa ChatGPT, e a Microsoft, sua principal investidora, por violação de direitos autorais.

Outros veículos de comunicação optaram por fechar acordos com esta empresa pioneira em IA.

As empresas de tecnologia podem não ter outra opção senão investir a fundo para melhorar os seus produtos, já que suas bases de dados e materiais para treinar os seus modelos estão esgotando.

A imprensa americana publicou recentemente que os novos modelos em desenvolvimento dão sinais de ter atingido o seu limite, especialmente no Google, Anthropic e OpenAI.

"Na Internet, você coleta material lícito e ilícito e muito conteúdo pirateado. Isso implica um problema jurídico. Sem esquecer o problema da qualidade dos dados", afirma Julien Chouraqui, do SNE.

"Para que o desenvolvimento de um mercado seja alcançado sobre uma base virtuosa, todos os atores devem estar envolvidos", destaca.

(S.G.Stein--BBZ)