一种为机器学习而生的数据结构,非结构化多模态数据的数据结构
一种为机器学习而生的数据结构,非结构化多模态数据的数据结构 DocArray是一个库,用于存储传输中的嵌套、非结构化、多模态数据,包括文本、图像、音频、视频、3D 网格等。它允许深度学习工程师使用Pythonic API有效地处理,嵌入,搜索,推荐,存储和传输多模态数据 跨/多模式世界之门:用于表示复杂/混合/嵌套文本、图像、视频、音频、3D 网格数据的超表达数据结构。、、、等基础数据结构。 数据科学强国:通过 CPU/GPU 上的 Torch/TensorFlow/ONNX/PaddlePaddle 大大加快数据科学家在嵌入、k-NN 匹配、查询、可视化和评估方面的工作。 传输中的数据:针对网络通信进行了优化,随时可以使用 Protobuf、字节、base64、JSON、CSV、DataFrame 中的快速压缩序列化。非常适合流式传输和内存不足的数据。 一站式K-NN:主流向量数据库的统一且一致的API,允许最近邻搜索,包括Elasticsearch、Redis、ANNLite、Qdrant、Weaviate。 对于现代应用程序:GraphQL 支持使您的服务器在请求和响应方面具有通用性;内置数据验证和 JSON Schema (OpenAPI) 帮助您构建可靠的 Web 服务。 Pythonic:设计得像 Python 列表一样简单。如果你知道如何使用 Python,你就会知道如何使用 DocArray。直观的习惯用法和类型注释简化了您编写的代码。 与IDE集成:Jupyter notebook 和 Google Colab 上的漂亮打印和可视化;PyCharm 和 VS Code 中的全面自动完成和类型提示。 || #机器学习
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人