Skip to main content

多格式支持

Bella-Knowledge 支持多种文件格式的处理和解析。

支持的文件格式

文档类型

  • PDF
  • DOC/DOCX
  • TXT
  • HTML
  • Markdown

数据文件

  • CSV
  • Excel (XLSX/XLS)
  • JSON
  • JSONL

图片类型

  • PNG
  • JPEG/JPG
  • WEBP
  • GIF

文档解析能力

系统提供强大的文档解析功能,可以将非结构化文档转换为结构化数据。

DOM树解析

支持将文档解析为DOM树结构,便于后续处理。

智能提取

自动提取文档中的关键信息,包括:

  • 文本内容
  • 表格数据
  • 图片信息
  • 元数据

使用建议

  1. 格式选择: 根据使用场景选择合适的文件格式
  2. 文件大小: 单个文件不超过512MB
  3. 编码格式: 建议使用UTF-8编码