第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定

Google 推出 LangExtract —— 基于 Python 的非結(jié)構(gòu)化文本結(jié)構(gòu)化數(shù)據(jù)提取庫

本文已收录在Github关注我,紧跟本系列专栏文章,咱们下篇再续!

  • 🚀 魔都架构师 | 全网30W技术追随者
  • 🔧 大厂分布式系统/数据中台实战专家
  • 🏆 主导交易系统百万级流量调优 & 车联网平台架构
  • 🧠 AIGC应用开发先行者 | 区块链落地实践者
  • 🌍 以技术驱动创新,我们的征途是改变世界!
  • 👉 实战干货:编程严选网

Google 发布了 LangExtract,这是一款 开源 Python 库,旨在帮助开发者借助大型语言模型(如 Gemini 模型)从非结构化文本中提取结构化信息。该库能将自由格式的文本(如临床记录、法律文书、客户反馈等)转换成结构化数据。开发者只需用自然语言指令和示例数据,就能定义提取任务,从而更轻松地处理和整理各种非结构化内容。

LangExtract 的一大亮点是采用了 [受控生成技术](https://developers.googleblog.com/en/introducing-langextract-a-gemini-powered-information-extraction-library/#:~:text=What makes LangExtract effective for information extraction),保证提取出的信息格式统一,并能准确对应到原文中的来源位置。它会高亮显示相关的文本片段,让每个被提取的实体都能追溯到原始文档的确切位置,这大大提高了提取结果的透明度与可信度。

为了应对冗长复杂的文档,LangExtract 结合了 文本分块并行处理多轮提取 等先进策略。这些方法能有效提升召回率和准确率,让该库在处理大规模文本时依然保持高质量输出,因此适用于医疗、法律等多个领域,而且无需对底层模型进行大量微调。

LangExtract 支持集成多种大型语言模型,包括云端的 Gemini 和本地运行的平台(如 Ollama)。这种灵活性让开发者在不同模型环境下都能使用它来定义多种信息提取任务,而无需具备深厚的机器学习背景。

LangExtract 的发布引发了开发者社区的热烈反响。Akshay Goel 作为主要贡献者之一,表示对这一发布非常兴奋,并期待看到用户的各种创新应用,这也体现了该项目的协作精神。他在帖子中写道:

今天和团队一起发布 LangExtract,迫不及待想看看开发者社区会用它做出什么!

开发者 Kyle Brown 称其为人工智能透明度上的一次重大进步,将非结构化文本转化为结构化、易理解的数据。同时,社区还推出了 TypeScript 版本,使其不仅兼容 Google 的 Gemini,还能支持 OpenAI 模型,进一步扩大了使用范围。

对感兴趣的人来说——我已将它移植到 TypeScript,并加入了对 OpenAI 的支持,不再仅限于 Gemini。

该库采用 Apache 2.0 许可协议,可通过 pip 轻松安装,为开发者在应用中添加信息提取功能提供了一个强大且易用的工具。

本文由博客一文多发平台 OpenWrite 发布!

點(diǎn)擊查看更多內(nèi)容
TA 點(diǎn)贊

若覺得本文不錯(cuò),就分享一下吧!

評(píng)論

作者其他優(yōu)質(zhì)文章

正在加載中
JAVA開發(fā)工程師
手記
粉絲
1.4萬
獲贊與收藏
1479

關(guān)注作者,訂閱最新文章

閱讀免費(fèi)教程

  • 推薦
  • 評(píng)論
  • 收藏
  • 共同學(xué)習(xí),寫下你的評(píng)論
感謝您的支持,我會(huì)繼續(xù)努力的~
掃碼打賞,你說多少就多少
贊賞金額會(huì)直接到老師賬戶
支付方式
打開微信掃一掃,即可進(jìn)行掃碼打賞哦
今天注冊(cè)有機(jī)會(huì)得

100積分直接送

付費(fèi)專欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與 放棄機(jī)會(huì)
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

舉報(bào)

0/150
提交
取消