视频一致性模型（VideoLCM）

2024-04-03

AIGC

546 词

第一个视频一致性模型（VideoLCM）也来了！我们之前介绍过图像的LCM（访问微博正文，微博正文），现在视频的LCM也开始卷起来了。它只需 4 个采样步骤即可生成视频：生成 16 帧（分辨率为 256x256）仅需 10 秒！虽然还不是实时的（像图像LCM那样），但已经接近了！论文：arxiv.org/abs/2312.09109 VideoLCM: Video Latent Consistency Model（视频潜在一致性模型）论文摘要：一致性模型在高效图像生成方面表现出了强大的能力，并允许在几个采样步骤内进行合成，从而减轻了扩散模型中的高计算成本。然而，在更具挑战性和资源消耗的视频生成中，一致性模型的探索仍然较少。在本报告中，我们提出了 VideoLCM 框架来填补这一空白，该框架利用图像生成的一致性模型的概念，以最少的步骤有效地合成视频，同时保持高质量。VideoLCM 基于现有的潜在视频扩散模型，并结合一致性蒸馏技术来训练潜在一致性模型。实验结果揭示了我们的 VideoLCM 在计算效率、保真度和时间一致性方面的有效性。值得注意的是，VideoLCM 只...

《2023年我们为未来而阅读的书籍》

2024-04-03

AIGC>weibo

2.2k 词

《2023年我们为未来而阅读的书籍》 1. 我看到的世界 — 李飞飞 2023 李飞飞，这位90年代初来美的年轻中国女性，当时几乎不懂英语，更别提计算机视觉了。她绝不会想到自己的工作将深刻推动我们进入当前的人工智能热潮。她的ImageNet项目，至今已标注了超过1400万张图片，为训练AI算法打下了基础，使得DeepMind和OpenAI这样的AI先锋公司得以崛起。在《我看到的世界》一书中，李飞飞将自己的工作与个人经历紧密结合，讲述了她作为移民的奋斗历程以及成为领域内最受尊敬的人物之一的故事。如今，她是斯坦福大学人本人工智能研究所的联席主任，成为硅谷快速发展中代表人类立场的重要声音。她的故事不仅令人着迷，也让人感到谦逊。在我们寻找值得托付未来人工智能的领袖时，李飞飞的履历给人以极大的鼓舞。Dave Lee 2. 你的脸属于我们 Your Face Belongs to Us - Kashmir Hill 2023 人类的面容，历来被视为灵魂之窗的浪漫象征，在计算机算法眼中却不过是另一种身份识别的“指纹”。Kashmir Hill 扣人心弦的著作中，详细揭示了一个名为 ...

如何突破原生家庭

2024-04-03

classical

1.8k 词

如何突破原生家庭人受家庭影响最大，这一点毋容置疑。家庭的社会经济地位和资源，父母对孩子发展的支持度，以及父母本身的人生观世界观和心理素养都对孩子的影响最大父母决定了会把孩子送去怎样的学校读书，也决定了孩子未来的兴趣启蒙，这对几乎所有的人来说都是不可抗拒的自然力社会能做的的确不多，除非非常恶劣的父母，对孩子身心产生了巨大的伤害，可以剥夺监护人资格，但是大部分人会“受困“其中如果你拥有一个支持自己发展的父母和家庭，应该感到幸运。如果拥有一个不能支持自己发展，但是也不怎么管自己的父母和家庭也应该感到幸运。如果遇到一个不支持自己发展又会严管自己的家庭，可能值得继续看下去当不幸身处一个不是那么好的环境中时，有一个好的方法，就是要自己主动寻找那些能指导你的人，不要放弃自己。能指导自己的人实际上存在于社会之中，他们可能不大显著，不怎么显山露水，他们可能是身边随和的同学和老师，他们有主见，并不只以学习分数为重(当然也不会认为学习不重要)，他们通常在学习和教学上都很有一套自己的方法，并且还有许多课外兴趣，如果这些兴趣也是你所喜欢的，可以参与到他们之中去，并观察和学习，甚至请教他们学...

使用LangChain框架结合大型语言模型（LLM）生成乳腺超声（BUS）报告的方法

2024-04-03

AIGC>weibo

848 词

使用LangChain框架结合大型语言模型（LLM）生成乳腺超声（BUS）报告的方法这篇论文介绍了一种使用LangChain框架结合大型语言模型（LLM）生成乳腺超声（BUS）报告的方法。地址：arxiv.org/pdf/2312.03013.pdf 这种方法通过整合多个图像分析工具，旨在提高报告的准确性和标准化程度，减轻放射科医生和医疗专业人员的工作负担。以下是文章的核心点：背景：乳腺超声是乳腺成像的关键诊断工具，用于早期发现和特征乳腺异常。然而，手动创建超声图像的全面医疗报告是一个耗时的过程，且结果可能因临床医生而异。方法：提出了一种新方法，通过LangChain框架结合LLM来生成BUS报告。LangChain是一个基于LLM的框架，可以调用专门的工具来处理不同的任务。文章中使用了三个主要工具：“可疑描述工具”、“类别分类工具”和“探头信息工具”。工具细节： “可疑描述工具”结合了形状、边缘和回声分类网络，用于描述可疑实体的特征。 “类别分类工具”根据乳腺成像报告和数据系统（BI-RADS）将图像分类为阴性、良性或高度提示恶性。 “探头...

新年幸福秘诀：不要过劳

2024-04-03

classical

2.7k 词

新年幸福秘诀：不要过劳转译自WSJ：《新年幸福秘诀：不要过劳》过度追求事业和过度思考，本来是为了寻求安全感，却可能严重伤害心理与身体健康。迎接新年，我们总是立下种种决心：改变体态，提升事业，整顿家居，乃至培养新兴趣。我们努力做得更多——加倍努力锻炼，加倍勤奋工作，加倍参与活动与社交。乍一看，这样的努力似乎很美好。但实际上，过度的追求同样潜藏着不好的一面，需要引起我们的警惕。作为神经心理学家，我经常研究人们对压力的反应。在工作中，我常帮助人们认识到一系列我称之为“过度行为”（the Overs）的自我挫败行为及其影响。这包括：过度工作（overworking）、过度追求（overachieving）、过度思考（overthinking）、过度解释（overexplaining）、过度给予（overgiving）、过度承诺（overcommitting）以及过度适应（overaccommodating）。这些“过度行为”，是我们为了给自己营造一种心理安全感而采取的行为。它们是一种调节神经系统的方式。当你感到焦虑、压力、挫败感或不确定时，是因为你大脑中的威胁网络被激活了：你...

Movie-web ：一个非常简洁独特的电影网站开源程序

2024-04-03

AIGC>weibo

371 词

Movie-web ：一个非常简洁独特的电影网站开源程序 Movie-web ：一个非常简洁独特的电影网站开源程序 Movie-web最大的特点是它不直接存储或托管任何电影媒体文件内容，而是从第三方流媒体服务中直接获取内容。有点像搜索引擎一样，你只需要输入电影或者电视剧名称，即可搜索出你要看内容。点击即可直接帮你连接到播放源，直接观看… 可本地部署！主要功能特点：自动保存进度：可选地同步到账户中。书签功能：可以标记想要观看的电影或电视节目。简约界面：界面简洁，只显示所需内容，没有算法来吸引用户。托管简便：只需要一个静态网站和代理，如果需要跨设备同步，则可选后端。第三方内容获取：所有媒体内容都是直接从第三方流媒体服务获取，不在服务器上存储任何文件或媒体。 GitHub：github.com/movie-web/movie-web 在线体验：网页链接

内存管理

2024-04-03

AIGC

1.4k 词

程序在运转一段时间后，内存因泄露而持续增长，或者因碎片化占用导致分配内存不足，最后被系统 Kill 出现 OOM 报错的问题十分常见，无论是什么语言编写的代码，只要业务流量足够大，或者用户输入足够复杂，就比较容易出现此类问题。内存管理一般会涉及到三层：用户程序层、C 运行时库层和内核层。如果是因为用户程序层导致的内存使用不当，这类问题是比较好排查的，一般可以在 OOM 之前，通过 heap profiling 将大内存块给分析出来，例如 Node.js 可以使用 llnode/andb 等工具进行排查，Python 可以使用 Heapy/objgraph 等工具排查。但如果内存问题出现在 C 运行时库层（glibc），定位起来就较为麻烦了。glibc 是介于用户程序层和内核层之间的一个内存管理器，用户程序一般不会直接向内核申请内存，因为两个 context 之间的切换开销比较大，而是通过 glibc 预先从内核申请一大块内存，然后用户程序再向 glibc 申请资源，只有资源不足的时候，glibc 才会再次向内核继续申请资源。这也意味着 glibc 需要完成复杂的内存分配和...

利用多模态 LLM 来理解和操作网页的项目SeeAct

2024-04-03

AIGC>weibo

358 词

利用多模态 LLM 来理解和操作网页的项目SeeAct 另一个利用多模态 LLM 来理解和操作网页的项目SeeAct。这个Agents项目利用GPT-4V 等 LMM 来直观地感知网站并生成文本形式的计划。然后，文本计划会被转换为基于 HTML 元素和操作在网站上执行。#AI##LLM# 这个项目可以成功完成不同网站上 50 % 的任务，而 GPT-4V 是 20%。但是也有一些问题，目前最佳的方法与理论上完美结果之间还存在着20-25%左右的差距。在众多尝试过的方法中，一种综合运用HTML文本和视觉元素的策略表现最为出色，并且比图像注释策略提升了高达30%。论文地址：https://browse.arxiv.org/html/2401.01614v1 GPT-4V(ision) is a Generalist Web Agent, if Grounded

当存款达到100万以后的习惯

2024-04-03

AIGC>weibo

692 词

当存款达到100万以后的习惯当存款达到100万以后，你就会发现一个现象，一个普通家庭越来越有钱的习惯： 1、不买零食，零食虽然好吃，但是贵，想要吃饱的话，得费普通饭菜几倍的钱。 2、学会做饭，每天早上起来做早餐，比外卖吃早餐便宜不少，单位没免费吃饭的话，自己做好饭菜带去吃，自己做饭菜，比在外面吃，可以省50%以上。 3、婚后，两代人住在一起吃饭，柴米油盐酱醋茶等等都可以节省不少钱，至少节省50%以上的钱。 4、如果是在农村，可以自己再种点菜，养点鸡鸭鹅等，可以省很多菜钱。 5、小孩可以让父母带，自己去上班，两个人上班收入会更多。 6、可买可不买的东西，一律不买。 7、可以重复利用的东西，要重复利用。 8、家里的纸皮等等，别丢了，放在一个角落，等累积多了拿去卖。 9、尽量少下馆子，自己在家做饭吃，可以省不少。 10、不吃夜宵，不点外卖，不喝奶茶，不喝饮料，不喝咖啡，不吃炸鸡，不喝酒，不抽烟。 11、不买手表，手机看时间就够了。 12、不买玉，少买金银首饰。 13、先定一个目标，存它30万，已经存了的钱，都存三年期定期。 14、每个月尽量控制自己的生活成本，比如每个月的生活费...

AI 股票交易

2024-04-03

classical

1.4k 词

AI 股票交易如果让 AI 充当股票交易员，它能遵守规则不进行内幕交易不欺骗客户吗？这篇文章给了你答案：即使被明令禁止，这个 AI 股票交易者还是进行了内幕交易，并对此撒谎展示一个机器人在金融图表背景前的图片新研究显示，大语言模型可能具备欺骗用户的能力。研究人员开发了一个 AI 股票交易系统，以探究其是否会在压力下从事内幕交易。结果显示，这个 AI 系统不仅进行了内幕交易，还向其假设的上级撒谎，解释了其作出决策的原因。需要指出的是，此 AI 系统事先已被告知内幕交易是违法行为。新研究表明，GPT-4 —— 即OpenAI’s ChatGPT背后的大语言模型 —— 在面临巨大成功压力时，可能会背离其训练时的行为准则。 Apollo Research 的研究人员在一篇 11 月发表的论文网页链接中探讨了一个问题：即使 AI 被训练为“有益、无害且诚实”，它是否还能“策略性地欺骗”用户。他们把“策略性欺骗”定义为有意识地让其他实体产生错误认识，以达到某种目的。为此，他们设计了一个模拟测试环境。在这个环境中，名为 Alpha 的 GPT-4 模型被设定为一个自主...

最新文章

归档

视频一致性模型（VideoLCM）

《2023年我们为未来而阅读的书籍》

如何突破原生家庭

使用LangChain框架结合大型语言模型（LLM）生成乳腺超声（BUS）报告的方法

新年幸福秘诀：不要过劳

Movie-web ：一个非常简洁独特的电影网站开源程序

内存管理

利用多模态 LLM 来理解和操作网页的项目SeeAct

当存款达到100万以后的习惯

AI 股票交易