阿隆自留地

hacknews-daily

用一张RTX 3090跑Llama 70B:NTransformer如何把NVMe硬盘变成推理内存

一位开发者构建了NTransformer——一个C++/CUDA推理引擎,通过NVMe直通GPU技术在RTX 3090(24GB显存)上跑通Llama 3.1 70B,相比mmap基线实现83倍加速。0.5 tok/s的实际速度谈不上实用,但整个工程的技术路径和优化思路本身,是对「消费级硬件的物理极限在哪里」的一次系统性探索,灵感意外地来源于对PS2游戏机的研究。

hacknews-daily

联邦化的TikTok能解决什么问题:Loops上线了,争议也来了

dansup 开发的联邦化短视频平台 Loops 刚刚发布了 App Store 版本进入公开测试阶段,顺势登上了 HN 首页。它基于 ActivityPub,和 Mastodon、Pixelfed 等应用共享同一个联邦协议,主打'没有算法操控、没有广告、没有公司控制'。但 HN 的评论里有很多尖锐的东西:联邦化能解决的是 TikTok 的哪些问题?内容审核的联邦化难题、服务器成本、开发者社区分裂,以及对 dansup 本人的争议,都在评论区一一呈现。

hacknews-daily

每月$249被封号:OpenClaw盗用Antigravity授权引发的AI订阅信任危机

一批每月花249美元订阅Google AI Ultra的用户,某天发现自己的Antigravity和Gemini CLI突然被封,原因是他们使用了一款叫OpenClaw的第三方工具。这款工具复用了Antigravity自己的OAuth client ID,以更低成本提供API访问能力,结果被Google以'零容忍政策'封号,11天后没有任何官方回应,账号没有恢复,用户还在继续被扣费。这件事在HN上引发了近620条评论,讨论触及AI订阅经济的可持续性、AI辅助快速开发的责任归属、Google账号依赖的风险,以及平台封号应不应该有比例原则。

hacknews-daily

一个人意外控制了7000台机器人吸尘器:物联网安全的老问题,新玩意儿

一位工程师在逆向工程自己的DJI Romo机器人时,意外发现同一组凭证可以访问全球24个国家7000台同款设备的实时摄像头、麦克风、地图和GPS位置。这个漏洞已于2月修复,但它揭示的问题远不止于一家公司的代码失误——而是整个消费级物联网行业的系统性安全欠账。

hacknews-daily

CXMT半价DDR4搅动全球内存市场:韩国芯片巨头的护城河正在被侵蚀

中国内存厂商CXMT以约市场价一半的价格供应DDR4芯片,正在撼动三星和SK海力士的传统DRAM基本盘。与此同时,DDR4价格一年内上涨逾8倍,AI基础设施需求推高了高端HBM市场。这场博弈的背后,是国家补贴、技术路径选择、以及全球内存供应链格局的深层重组。

hacknews-daily

先逼它交计划书,再让它写代码:一个用了9个月的Claude Code工作流

Boris Tane 在使用 Claude Code 9个月后写下了这篇文章,核心原则只有一条:在Claude写任何代码之前,必须先有一份你审阅并认可的书面计划。他的工作流分三个阶段:深度研究(写research.md)、计划与标注循环(写plan.md,反复添加注释直到满意)、最后一次性实现。这篇文章在HN上获得了929票和568条评论,引发了关于LLM提示词是否是迷信、AI辅助开发是否正在变成工程界的占星术、以及'不批准计划就不让它写代码'这条原则背后的认知科学基础的深度讨论

hacknews-daily

社交网络已死:我们是怎么把它变成注意力机器的

Susam Pal 在一篇文章中提出了一个精准的区分:现在的Facebook、Instagram、TikTok不是社交网络,而是注意力媒体(Attention Media)。本文梳理这一概念的演变历程,探讨为什么算法驱动的信息流让平台从连接工具异化为注意力捕猎机,以及我们还有哪些出路。

Producthunt-Daily

Cue深度评测:一站式AI社交管理,如何让创作者与初创公司实现高效增长

Cue是一款面向创作者和初创公司的一站式社交媒体管理平台,支持8大平台智能调度、AI辅助内容创作与平台定制化发布,旨在通过统一仪表盘、智能算法与开放API,解决多平台运营的碎片化与效率低下问题。

6436
hacknews-daily

Clawdbot:开源个人AI助手的深度解析与实践指南

本文深入解析Clawdbot开源个人AI助手的技术架构、核心特性与实践应用。探讨其如何通过本地化部署、多模型支持与RAG技术,在保护隐私的同时提供强大的自动化能力,为开发者打造真正私有的智能工作伴侣。

2 / 2