必看的CV入门数据

语义理解 因果推理 常识规范

富文本:文、图、音 紫东太初基础模型开源: https://gitee.com/zidongtaichu/multi-modal-models

Jina:https://github.com/jina-ai/jina

我们平时的数据更多的都是非结构化的数据,传统搜索技术主要基于文本标签。神经搜索可以针对图像、音频、视频甚至 3D Mesh 进行搜索,但是搭建神经搜索系统的工作却非常复杂,涉及到工程化、AI 建模、DevOps 等。Jina 降低了搭建神经搜索系统的复杂性,提供了涵盖整个开发过程的端到端开源技术栈,利用 Jina 能很方便的搭建出自己的搜索引擎,下面是一些案例:

口红搜索引擎:https://github.com/lhr0909/lipstick-db AI 视频搜剪神器:https://github.com/ArthurKing01/jina-clip 3 分钟搭建服装搜索系统: https://github.com/hanxiao/mindspore-jina-example

CV

NLP(NLU + NLG)

VA(ASR + TTS)

VoW:语音唤醒

VAD:语音活动检测

ASR:wenet流式识别(数据3400h,wer18%,最好4wh)

语音指令

标点预测

TTS

数据挖掘

搜广推

运筹

风控

量化交易

sub title

page…

about thumbnail

add the thumbnail url

about icon

such as book, code, web, chat, note, game, link, design, image