Computer vision basic tasks
Some understanding of computer vision basic tasks.
计算机视觉任务
主要分为几大类:
- 输入一张完整图像 –> single label(single object)–> ==classification==
- 输入一张完整图像 –> single object + anchor–> ==classification + localization==
- 输入一张完整图像 –> multiple object anchors–> ==object detection==
- 输入一张完整图像 –> 每一个对象具体的pixel–> ==segmentation==
-
- semantic segmentation –> 让每一个pixel都有一个label
- instance segmentation –> 区分每一个物体
-
机器学习和神经网络简介
机器学习的典型范式
- 监督学习
- 无监督学习
- 自监督学习
- 强化学习
交叉熵损失函数 – 极大似然估计
对于预测的类别概率$P \in [0, 1]^K$和类别真值$y \in \left[1, \cdots, K \right]$,定义交叉熵损失为: $$ L(P, y) = - logP_y $$
反向传播算法
推荐热门AI研究方向
-
人工智能的可解释性分析、显著性分析
-
图机器学习、图神经网络(AlphaFold2)、知识图谱
-
人工智能+VR/AR/数字人/元宇宙
-
轻量化压缩部署:Web前端、智能手机、服务器、嵌入式硬件
-
Al4Science:天文、物理、蛋白质预测、药物设计、数学证明
-
做各行各业垂直细分领域的人工智能应用
-
神经辐射场(NERF)
-
扩散生成模型(Diffusion)、AIGC、跨模态预训练大模型
-
隐私计算、联邦学习、可信计算
-
AI基础设施平台(数据、算力、教学、开源、算法工具包)
-
认知科学+类脑计算+计算神经科学