一种为机器学习而生的数据结构,非结构化多模态数据的数据结构
一种为机器学习而生的数据结构,非结构化多模态数据的数据结构DocArray是一个库,用于存储传输中的嵌套、非结构化、多模态数据,包括文本、图像、音频、视频、3D网格等。它允许深度学习工程师使用PythonicAPI有效地处理,嵌入,搜索,推荐,存储和传输多模态数据跨/多模式世界之门:用于表示复杂/混合/嵌套文本、图像、视频、音频、3D网格数据的超表达数据结构。、、、等基础数据结构。数据科学强国:通过CPU/GPU上的Torch/TensorFlow/ONNX/PaddlePaddle大大加快数据科学家在嵌入、k-NN匹配、查询、可视化和评估方面的工作。传输中的数据:针对网络通信进行了优化,随时可以使用Protobuf、字节、base64、JSON、CSV、DataFrame中的快速压缩序列化。非常适合流式传输和内存不足的数据。一站式K-NN:主流向量数据库的统一且一致的API,允许最近邻搜索,包括Elasticsearch、Redis、ANNLite、Qdrant、Weaviate。对于现代应用程序:GraphQL支持使您的服务器在请求和响应方面具有通用性;内置数据验证和JSONSchema(OpenAPI)帮助您构建可靠的Web服务。Pythonic:设计得像Python列表一样简单。如果你知道如何使用Python,你就会知道如何使用DocArray。直观的习惯用法和类型注释简化了您编写的代码。与IDE集成:Jupyternotebook和GoogleColab上的漂亮打印和可视化;PyCharm和VSCode中的全面自动完成和类型提示。#机器学习