РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ И УДАЛЕНИЕ ФОНА: СОВРЕМЕННЫЕ МЕТОДЫ И ТЕХНОЛОГИИ

Авторы

  • Орлова Лариса Викторовна Автор

Ключевые слова:

компьютерное зрение, удаление фона, нейросети, сегментация, искусственный интеллект, глубокое обучение, распознавание изображений.

Аннотация

Распознавание изображений и удаление фона являются важными задачами в компьютерном зрении и широко применяются в электронной коммерции, дополненной реальности, медицине и других сферах. В данной статье рассматриваются основные методы распознавания изображений, включая классические алгоритмы и современные нейросетевые подходы. 
Анализируются методы удаления фона, основанные на глубоких нейронных сетях, а также возможности использования трансформеров для сегментации изображений. В статье приведен сравнительный анализ технологий и 
обсуждаются перспективные направления развития данной области. 

Библиографические ссылки

1.

Krizhevsky A., Sutskever I., Hinton G. "ImageNet Classification with Deep

Convolutional Neural Networks" // Advances in Neural Information Processing

Systems, 2012.

2.

He K., Zhang X., Ren S., Sun J. "Deep Residual Learning for Image

Recognition" // IEEE Conference on Computer Vision and Pattern Recognition

(CVPR), 2016.

3.

Redmon J., Farhadi A. "YOLOv3: An Incremental Improvement" // arXiv,

2018.

4.

Lowe D.G. "Distinctive Image Features from Scale-Invariant Keypoints" //

International Journal of Computer Vision, 2004.

5.

R-CNN: Region-based Convolutional Neural Networks // IEEE Transactions

on Pattern Analysis and Machine Intelligence, 2015.6.

Zhao H., Shi J., Qi X., Wang X., Jia J. "Pyramid Scene Parsing Network" //

CVPR, 2017.

7.

Xiao T., Liu Y., Zhou B., Jiang Y., Sun J. "Unified Perceptual Parsing for

Scene Understanding" // ECCV, 2018.

8.

Meta AI. "Segment Anything Model (SAM)" // arXiv, 2023.

9.

He K., Gkioxari G., Dollár P., Girshick R. "Mask R-CNN" // International

Conference on Computer Vision (ICCV), 2017.

10.

Chen L.C., Papandreou G., Schroff F., Adam H. "Rethinking Atrous

Convolution for Semantic Image Segmentation" // arXiv preprint, 2017.

11.

Ronneberger O., Fischer P., Brox T. "U-Net: Convolutional Networks for

Biomedical Image Segmentation" // International Conference on Medical Image

Computing and Computer-Assisted Intervention, 2015.

12.

Zhang X., Zhang Y., Kong Y. "MODNet: Real-Time Trimap-Free Portrait

Matting via Objective Decomposition" // CVPR, 2021.

13.

Chen L.C., Zhu Y., Papandreou G., Schroff F., Adam H. "Encoder-Decoder

with Atrous Separable Convolution for Semantic Image Segmentation" // ECCV, 2018.

14.

Sun K., Xiao B., Liu D., Wang J. "Deep High-Resolution Representation

Learning for Human Pose Estimation" // IEEE Transactions on Pattern Analysis and

Machine Intelligence, 2019.

15.

Kirillov A., Mintun E., Ravi N., Mao H., Rolland C., Gustafson L., Xiao T.,

Whitehead S., Dollár P. "Segment Anything" // arXiv preprint, 2023.

16.

Dosovitskiy A., Beyer L., Kolesnikov A., Weissenborn D., Zhai X. "An Image

is Worth 16x16 Words: Transformers for Image Recognition at Scale" // ICLR, 2021.

Опубликован

2025-03-11

Как цитировать

РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ И УДАЛЕНИЕ ФОНА: СОВРЕМЕННЫЕ МЕТОДЫ И ТЕХНОЛОГИИ . (2025). ОБРАЗОВАНИЕ НАУКА И ИННОВАЦИОННЫЕ ИДЕИ В МИРЕ, 65(1), 419-424. https://scientific-jl.com/obr/article/view/4614