Đăng ký để nhận thông báo về bài đăng mới:

Giúp bảo vệ các nhà báo và các hãng tin tức địa phương khỏi các trình thu thập dữ liệu AI thông qua Dự án Galileo

2025-09-23

Cần 5 phút để đọc
Bài đăng này cũng có sẵn bằng English, Français, Deutsch, 日本語, 한국어, Español, Indonesia, Nederlands, ไทย繁體中文.

Chúng tôi rất vui mừng được thông báo rằng Dự án Galileo giờ đây sẽ bao gồm quyền truy cập vào các dịch vụ Bot ManagementAI Crawl Control của Cloudflare. Những người tham gia chương trình, bao gồm khoảng 750 nhà báo, tổ chức tin tức độc lập và các tổ chức phi lợi nhuận khác hỗ trợ việc thu thập tin tức trên toàn thế giới, giờ đây sẽ có thể bảo vệ trang web của mình khỏi các trình thu thập dữ liệu AI- hoàn toàn miễn phí. 

Dự án Galileo là chương trình miễn phí của Cloudflare nhằm giúp bảo vệ những tiếng nói quan trọng của công dân trên môi trường trực tuyến. Ra mắt vào năm 2014, hiện chương trình bao gồm hơn 3.000 tổ chức tại 125 quốc gia và đóng vai trò là nền tảng cho các chương trình miễn phí khác của Cloudflare giúp bảo vệ các cuộc bầu cử dân chủ, các học khu công lập, các phòng khám y tế cộng đồngcơ sở hạ tầng quan trọng khác.  

Mặc dù chúng tôi cho rằng tất cả những người tham gia Dự án Galileo đều sẽ được hưởng lợi từ các dịch vụ miễn phí bổ sung này, nhưng chúng tôi cũng tin rằng chúng rất cần thiết cho các tổ chức tin tức. 

Các tổ chức tin tức, đặc biệt là các hãng tin tức địa phương, đang phải đối mặt với những thách thức lớn trong quá trình chuyển đổi sang trang web vận hành bởi AI. Khi mọi người ngày càng chuyển sang sử dụng các mô hình AI để tìm kiếm thông tin, lượng truy cập web đến trang web thực tế nơi thông tin đó xuất phát sẽ ngày càng ít đi. Những ngành công nghiệp, như các tổ chức tin tức, vốn phụ thuộc vào lưu lượng truy cập của người dùng để tạo doanh thu, đang ngày càng đối mặt với rủi ro cao hơn. 

Cho phép các tổ chức tin tức giám sát và kiểm soát cách thức trình thu thập dữ liệu AI tương tác với trang web của họ sẽ giúp họ bảo vệ nội dung tốt hơn và đưa ra quyết định có cơ sở hơn khi hợp tác với các công ty AI. Cuối cùng, mục tiêu của chúng tôi là cung cấp các công cụ mà các tổ chức tin tức cần để thương lượng mức thù lao công bằng cho các tác phẩm của họ.  

Lưu lượng và tin tức

AI đang thay đổi cơ bản hướng truy cập trên Internet. Cloudflare gần đây đã công bố dữ liệu cho thấy với OpenAI, việc các chủ sở hữu trang web đạt được cùng lượng truy cập trở nên khó khăn gấp 750 lần so với khi chỉ dựa vào công cụ tìm kiếm của Google trước đây. Với Anthropic, việc đạt cùng lượng truy cập trở nên khó khăn hơn gấp 30.000 lần. 

Các tổ chức tin tức dựa vào lưu lượng truy cập, không chỉ để kết nối với độc giả mà còn tạo ra doanh thu từ đăng ký, quảng cáo, thương mại điện tử và cấp phép. Giám đốc điều hành của tờ Financial Times gần đây tuyên bố rằng AI đã gây ra sự sụt giảm "đột ngột và kéo dài" từ 25% đến 30% lượng truy cập vào các bài viết của tờ báo này thông qua công cụ tìm kiếm." 

Nguy cơ mất lượng truy cập và doanh thu của người dùng xảy ra vào thời điểm vốn đã bấp bênh đối với ngành tin tức. Có nhiều tài liệu ghi chép rằng các tờ báo và đài phát thanh tin tức nhỏ, độc lập vẫn phải đối mặt với áp lực tài chính lớn, đặc biệt là tại Hoa Kỳ. Theo chia sẻ gần đây của Quốc hội Hoa Kỳ, có hơn hai tờ báo đóng cửa mỗi tuần vào năm 2024, và một phần ba số tờ báo của cả nước sẽ đóng cửa trước đầu năm 2025. Một báo cáo năm 2024 của Sáng kiến Tin tức Địa phương Tây Bắc cho biết hơn 206 quận của Hoa Kỳ không có bất kỳ nguồn tin tức địa phương nào và 1.561 quận chỉ có một nguồn tin tức địa phương.  

Việc cắt giảm nguồn ngân sách gần đây cho Public Broadcasting Corporation và National Public Radio, những đơn vị từng cung cấp tài trợ, lập trình và hỗ trợ khác cho các đài tin tức công cộng trên khắp Hoa Kỳ, đã gây thêm áp lực cho các tổ chức này khi dự kiến sẽ có thêm nhiều đài phải đóng cửa

Trao lại quyền kiểm soát cho các nhà báo

Bước đầu tiên quan trọng trong việc giúp các nhà báo và tổ chức tin tức thích ứng với trang web do AI vận hành là cung cấp các công cụ giúp họ giám sát và kiểm soát quyền truy cập của các mô hình AI vào nội dung của họ. 

“Trong thời đại được định hình bởi AI và sự gián đoạn số, việc cung cấp các công cụ mạnh mẽ cho các hãng truyền thông độc lập không chỉ là sự hỗ trợ - nó còn là sợ dây cứu sinh” - Meera, Giám đốc điều hành của Internews Europe

"Các nhà xuất bản độc lập cần những công cụ dễ sử dụng và có giá cả phải chăng để giúp họ có thể tập trung vào việc phát triển doanh nghiệp của mình. LION đánh giá cao tính bảo mật và an toàn mà Cloudflare đã cung cấp cho các thành viên của chúng tôi thông qua Dự án Galileo trong nhiều năm qua, và chúng tôi rất vui khi thấy ngày càng có nhiều nguồn lực để giúp các thành viên quản lý bối cảnh an ninh số đang phát triển nhanh chóng."  - Sarah Gustavus Lim, Giám đốc Thành viên LION 

Bot ManagementAI Crawl Control của Cloudflare được thiết kế chính xác cho những mục đích này. Bot Management là công cụ bảo mật sử dụng học máy để phân tích lưu lượng truy cập web nhằm phân biệt giữa các bot tốt, như trình thu thập dữ liệu của công cụ tìm kiếm, và các bot xấu tấn công trang web hoặc đánh cắp thông tin đăng nhập. Công cụ này cho phép chủ sở hữu trang web chặn các bot xấu truy cập vào trang web của họ, đồng thời đảm bảo các bot hữu ích có thể tiếp tục thực hiện công việc của mình.

AI Crawl Control cung cấp các công cụ tương tự để xác định và quản lý các trình thu thập dữ liệu AI. Cloudflare sử dụng nhiều kỹ thuật khác nhau để xác định và phân loại trình thu thập dữ liệu (tiêu đề HTTP, phương pháp suy đoán và các hành vi khác) giúp chủ trang web có được khả năng phân tích hoạt động của chúng theo loại (ví dụ: Tìm kiếm AI, trình thu thập dữ liệu AI), họ đến từ đâu (Google, OpenAI, Anthorpic, v.v.) và họ đang truy cập vào nội dung nào. Sau đây là loại dữ liệu mà công cụ AI Crawl Control của Cloudflare có thể cung cấp (sử dụng tên miền radar.cloudflare.com ) làm ví dụ:

Cloudflare kết hợp những thông tin chi tiết này với các công cụ kiểm soát dễ sử dụng, cho phép chủ trang web ra quyết định có cơ sở về việc có nên cho phép dữ liệu của họ được truy cập hay không, bao gồm chỉ cho phép một số loại bot nhất định hoặc các công ty AI cụ thể. Ví dụ, điều này sẽ cho phép một tờ báo địa phương quyết định: chặn tất cả các trình thu thập dữ liệu AI và duy trì kết nối trực tiếp với độc giả qua trang web của mình; chỉ chặn các trình thu thập dữ liệu AI trong khi vẫn cho phép các trình thu thập dữ liệu tìm kiếm AI có mang lại lượt truy cập; hoặc thương lượng và bán quyền truy cập độc quyền nội dung của họ cho một công ty AI duy nhất. Hình ảnh sau đây cho thấy cách AI Crawl Control cho phép người dùng cho phép hoặc chặn quyền truy cập đối với từng trình thu thập dữ liệu cụ thể:

Chúng tôi cho rằng khả năng kiểm soát và giám sát hoạt động của trình thu thập dữ liệu AI sẽ cung cấp sự trợ giúp tức thì cho các tổ chức tin tức muốn bảo vệ nội dung của họ và hiểu cách các mô hình sử dụng dữ liệu của họ. 

Chúng tôi cũng cho rằng nó sẽ cung cấp những hiểu biết dài hạn hơn, từ đó cho phép các tổ chức tin tức đàm phán các mối quan hệ có lợi cho cả hai bên với các công ty AI theo thời gian.  

"Khả năng thực hiện chức năng dân chủ của phương tiện truyền thông độc lập thông qua thu thập tin tức và phân phối thông tin đáng tin cậy phụ thuộc vào việc tạo ra doanh thu không chịu ảnh hưởng bởi chính trị hoặc kinh doanh. Bằng việc theo dõi và kiếm tiền từ hoạt động thu thập dữ liệu trên các trang web của nhà xuất bản, các tổ chức báo chí và truyền thông có thể bảo vệ tài sản trí tuệ của họ đồng thời phát triển các nguồn doanh thu mới để hỗ trợ cho hoạt động báo chí chất lượng của họ." - Ryan Powell, Trưởng phòng Đổi mới và Kinh doanh Truyền thông tại Viện Báo chí Quốc tế

Một nền báo chí tự do, nhưng là chúng ta có thể giữ được nó

Báo chí là một phần nền tảng của xã hội tự do và nền quản trị dân chủ. Nó giúp giám sát quyền lực, đồng thời mang tiếng nói đến những người bị thiệt thòi và chưa được đại diện đầy đủ. Nó cũng bảo vệ các thị trường tự do và cởi mở, cho phép các công ty khởi nghiệp thách thức các công ty đương đại hùng mạnh.  

Các hãng tin tức địa phương đặc biệt giúp tạo nên bản sắc chung. Không chỉ đưa tin về các sự kiện cộng đồng, thể thao trung học, chợ nông sản và các doanh nghiệp mới mà còn giúp đảm bảo tính minh bạch và giám sát cần thiết đối với các quan chức địa phương, hội đồng nhà trường, sự kiện an toàn công cộng và các cuộc bầu cử. 

Hỗ trợ bảo vệ các nhà báo và tổ chức tin tức trên môi trường trực tuyến luôn là một phần trong sứ mệnh của Cloudflare. Chúng tôi coi đây là điều cần thiết cho doanh nghiệp của mình và tương lai của Internet.  

Nếu bạn muốn tìm hiểu thêm về Dự án Galileo, hãy đăng ký ngay hôm nay. Nếu bạn quan tâm đến việc giúp xây dựng mạng Internet tốt hơn, hãy tham gia cùng chúng tôi.

Chúng tôi bảo vệ toàn bộ các mạng của công ty, giúp khách hàng xây dựng các ứng dụng quy mô Internet một cách hiệu quả, tăng tốc bất kỳ trang web hoặc ứng dụng Internet nào, ngăn chặn các cuộc tấn công DDoS, chặn tin tặc và có thể giúp bạn trong hành trình đến với Zero Trust.

Truy cập 1.1.1.1 trên mọi thiết bị để bắt đầu sử dụng ứng dụng miễn phí của chúng tôi, giúp Internet của bạn nhanh hơn và an toàn hơn.

Để tìm hiểu thêm về sứ mệnh xây dựng Internet tốt hơn của chúng tôi, hãy bắt đầu tại đây. Nếu bạn đang tìm kiếm một định hướng nghề nghiệp mới, hãy xem các vị trí đang tuyển dụng của chúng tôi.
Birthday WeekProject GalileoTác độngQuản lý botAI

Theo dõi trên X

Jocelyn Woolbright|@jo_woolbright
Cloudflare|@cloudflare

Bài đăng liên quan

lúc 14:00 29 tháng 9, 2025

15 years of helping build a better Internet: a look back at Birthday Week 2025

Rust-powered core systems, post-quantum upgrades, developer access for students, PlanetScale integration, open-source partnerships, and our biggest internship program ever — 1,111 interns in 2026....