Unweight: 품질을 희생하지 않고 LLM을 22% 압축한 방법
2026-04-17
Cloudflare의 네트워크에서 LLM을 실행하려면 GPU 메모리 대역폭에 대해 더 현명하고 더 효율적이어야 합니다. 그래서 당사에서는 최대 22%의 모델 공간 축소를 달성하는 무손실 추론 시간 압축 시스템인 Unweight를 개발하여 그 어느 때보다 더 빠르고 저렴하게 추론을 제공할 수 있습니다....

2026-04-17
Cloudflare의 네트워크에서 LLM을 실행하려면 GPU 메모리 대역폭에 대해 더 현명하고 더 효율적이어야 합니다. 그래서 당사에서는 최대 22%의 모델 공간 축소를 달성하는 무손실 추론 시간 압축 시스템인 Unweight를 개발하여 그 어느 때보다 더 빠르고 저렴하게 추론을 제공할 수 있습니다....
2025-10-27
ACM의 인터넷 측정 컨퍼런스에 동시에, Cloudflare Research 팀은 측정 가능하고 복원력이 있으며 투명한 인터넷을 구축하기 위한 연구를 공유하기 위해 이번 주에 일련의 게시물을 게시할 예정입니다. 이 게시물에서는 인터넷 측정, 인터넷 복원력, 암호화, 네트워킹의 기본 개념을 다룹니다. ...
2023-09-28
Microsoft Edge에서 Cloudflare의 개인정보 보호 스택의 핵심 부분인 개인정보 보호 프록시 기술을 활용하여 Edge 보안 네트워크 기능을 사용하게 되었다는 소식을 알려드립니다. 이 통합으로 인해 Microsoft Edge 사용자는 다양한 웹 사이트에서 추적되지 않고 더욱 프라이빗하게 인터넷을 사용할 수 있습니다...
2022-10-27
Privacy Gateway를 사용하면 신뢰를 우선시하는 애플리케이션이 Cloudflare를 신뢰할 수 있는 Relay로 사용하여 인프라에 표시되는 IP 주소를 포함한 식별 정보를 제한할 수 있습니다...
2022-03-10
오늘, Clouldflare에서는 WhatsApp과 파트너십을 맺게 된 것을 기쁘게 생각하며 사용자가 웹에서 WhatsApp을 방문할 때 실행되는 코드가 WhatsApp에서 의도한 코드임을 사용자에게 보장하는 시스템을 제공하게 되었습니다...