РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ И УДАЛЕНИЕ ФОНА: СОВРЕМЕННЫЕ МЕТОДЫ И ТЕХНОЛОГИИ
Ключевые слова:
компьютерное зрение, удаление фона, нейросети, сегментация, искусственный интеллект, глубокое обучение, распознавание изображений.Аннотация
Распознавание изображений и удаление фона являются важными задачами в компьютерном зрении и широко применяются в электронной коммерции, дополненной реальности, медицине и других сферах. В данной статье рассматриваются основные методы распознавания изображений, включая классические алгоритмы и современные нейросетевые подходы.
Анализируются методы удаления фона, основанные на глубоких нейронных сетях, а также возможности использования трансформеров для сегментации изображений. В статье приведен сравнительный анализ технологий и
обсуждаются перспективные направления развития данной области.
Библиографические ссылки
1.
Krizhevsky A., Sutskever I., Hinton G. "ImageNet Classification with Deep
Convolutional Neural Networks" // Advances in Neural Information Processing
Systems, 2012.
2.
He K., Zhang X., Ren S., Sun J. "Deep Residual Learning for Image
Recognition" // IEEE Conference on Computer Vision and Pattern Recognition
(CVPR), 2016.
3.
Redmon J., Farhadi A. "YOLOv3: An Incremental Improvement" // arXiv,
2018.
4.
Lowe D.G. "Distinctive Image Features from Scale-Invariant Keypoints" //
International Journal of Computer Vision, 2004.
5.
R-CNN: Region-based Convolutional Neural Networks // IEEE Transactions
on Pattern Analysis and Machine Intelligence, 2015.6.
Zhao H., Shi J., Qi X., Wang X., Jia J. "Pyramid Scene Parsing Network" //
CVPR, 2017.
7.
Xiao T., Liu Y., Zhou B., Jiang Y., Sun J. "Unified Perceptual Parsing for
Scene Understanding" // ECCV, 2018.
8.
Meta AI. "Segment Anything Model (SAM)" // arXiv, 2023.
9.
He K., Gkioxari G., Dollár P., Girshick R. "Mask R-CNN" // International
Conference on Computer Vision (ICCV), 2017.
10.
Chen L.C., Papandreou G., Schroff F., Adam H. "Rethinking Atrous
Convolution for Semantic Image Segmentation" // arXiv preprint, 2017.
11.
Ronneberger O., Fischer P., Brox T. "U-Net: Convolutional Networks for
Biomedical Image Segmentation" // International Conference on Medical Image
Computing and Computer-Assisted Intervention, 2015.
12.
Zhang X., Zhang Y., Kong Y. "MODNet: Real-Time Trimap-Free Portrait
Matting via Objective Decomposition" // CVPR, 2021.
13.
Chen L.C., Zhu Y., Papandreou G., Schroff F., Adam H. "Encoder-Decoder
with Atrous Separable Convolution for Semantic Image Segmentation" // ECCV, 2018.
14.
Sun K., Xiao B., Liu D., Wang J. "Deep High-Resolution Representation
Learning for Human Pose Estimation" // IEEE Transactions on Pattern Analysis and
Machine Intelligence, 2019.
15.
Kirillov A., Mintun E., Ravi N., Mao H., Rolland C., Gustafson L., Xiao T.,
Whitehead S., Dollár P. "Segment Anything" // arXiv preprint, 2023.
16.
Dosovitskiy A., Beyer L., Kolesnikov A., Weissenborn D., Zhai X. "An Image
is Worth 16x16 Words: Transformers for Image Recognition at Scale" // ICLR, 2021.