El Internet Archive ha enfrentado restricciones de acceso por parte de sitios como Reddit, The New York Times y The Guardian, debido a preocupaciones sobre el scraping por parte de inteligencia artificial. Mark Graham, director del Internet Archive, considera que estas inquietudes son comprensibles pero infundadas.
En un nuevo blog publicado en TechDirt, titulado "Preservar la web no es el problema. Perderla lo es", Graham expone que la Wayback Machine está diseñada para ser utilizada por lectores humanos. Además, menciona que el archivo ha implementado medidas como limitación de tasas y monitoreo para prevenir que bots de gran escala roben información.
Graham argumenta que bloquear el acceso a archivos web podría resultar en un daño significativo al registro público y que es crucial permitir la preservación de sitios en internet para evitar alterar el registro histórico para futuras generaciones. A pesar de las preocupaciones sobre la inteligencia artificial, asegura que las bibliotecas no son el problema.
Asimismo, se destaca que algunos sitios con muros de pago podrían estar interesados en limitar las herramientas de archivo para evitar que los usuarios burlen esas restricciones. Este conflicto entre la necesidad de preservar la historia digital y la sostenibilidad de los medios plantea un desafío continuo.