多格式支持
Bella-Knowledge 支持多种文件格式的处理和解析。
支持的文件格式
文档类型
- DOC/DOCX
- TXT
- HTML
- Markdown
数据文件
- CSV
- Excel (XLSX/XLS)
- JSON
- JSONL
图片类型
- PNG
- JPEG/JPG
- WEBP
- GIF
文档解析能力
系统提供强大的文档解析功能,可以将非结构化文档转换为结构化数据。
DOM树解析
支持将文档解析为DOM树结构,便于后续处理。
智能提取
自动提取文档中的关键信息,包括:
- 文本内容
- 表格数据
- 图片信息
- 元数据
使用建议
- 格式选择: 根据使用场景选择合适的文件格式
- 文件大小: 单个文件不超过512MB
- 编码格式: 建议使用UTF-8编码