LangExtract 是 Google 开源的结构化信息提取库,使用大语言模型 (LLM) 从非结构化文本中提取结构化数据。 只需提供几个示例 (Few-shot),即可定义任意领域的提取任务,无需微调模型。
典型应用: 临床报告提取 (药物/剂量/症状) | 文学作品分析 (人物/情感/关系) | 合同文档结构化 | 实体关系抽取
运行提取后显示结果