Линейное растяжение яркости изображения
Ðвгений ÐоÑиÑов
понеделÑник, 17 ноÑбÑÑ 2014 г.
Ð ÑÑой ÑÑаÑÑе Ð¼Ñ Ð¿Ð¾Ð³Ð¾Ð²Ð¾Ñим о базовÑÑ Ð¼ÐµÑÐ¾Ð´Ð°Ñ Ð¾Ð±ÑабоÑки изобÑажений.
1 Ðведение
ÐблаÑÑи пÑÐ¸Ð¼ÐµÐ½ÐµÐ½Ð¸Ñ Ð¸ Ñели Ð´Ð»Ñ Ð¿ÑÐ¸Ð¼ÐµÐ½ÐµÐ½Ð¸Ñ Ð¼ÐµÑодов обÑабоÑки изобÑажений могÑÑ Ð±ÑÑÑ ÑамÑе ÑазнÑе.
- ÐолигÑаÑиÑ, дизайн â ÑлÑÑÑение каÑеÑÑва, ÑеÑÑÑÑ, изменение ÑазмеÑа и ÑоÑмÑ, композиÑиÑ.
- ÐнÑеÑÐ½ÐµÑ â поиÑк, анноÑаÑиÑ, поиÑк дÑбликаÑов, ÑаÑпознавание обÑекÑов.
- РобоÑÑ Ð¸ видеонаблÑдение â поиÑк и локализаÑÐ¸Ñ Ð¾Ð±ÑекÑов, оÑÑлеживание, ÑаÑпознавание обÑекÑов, ÑаÑпознавание жеÑÑов и ÑобÑÑий.
- ÐÑомÑÑленнÑе ÑиÑÑÐµÐ¼Ñ â диагноÑÑика, конÑÑÐ¾Ð»Ñ ÐºÐ°ÑеÑÑва.
- СпеÑÑÑÑекÑÑ Ð² кино â композиÑиÑ, монÑаж Ñонов, Ð·Ð°Ñ Ð²Ð°Ñ Ð´Ð²Ð¸Ð¶ÐµÐ½Ð¸Ñ.
ÐзобÑажение в ÑиÑÑовом виде можно пÑедÑÑавиÑÑ ÑазнÑми ÑпоÑобами,
напÑÐ¸Ð¼ÐµÑ ÐºÐ°Ðº пÑогÑаммÑ, Ñ.е. ÑпоÑÑдоÑеннÑÑ Ð¿Ð¾ÑледоваÑелÑноÑÑÑ ÑлеменÑаÑнÑÑ
дейÑÑвий —
ÑиÑование гÑаÑиÑеÑкиÑ
пÑимиÑивов (ÑоÑек, окÑÑжноÑÑей и Ñ.п.). ÐÑо Ñ.н. векÑоÑнÑй ÑоÑмаÑ.
ÐÑ Ð±Ñдем ÑабоÑаÑÑ Ñ ÑаÑÑÑовÑм ÑоÑмаÑом, ÑÑо пÑоÑÑо маÑÑиÑа из ÑоÑек, ÑоÑÐºÑ Ð¼Ð¾Ð¶Ð½Ð¾ кодиÑоваÑÑ ÑазнÑми ÑпоÑобами.
Ðалее Ð¼Ñ Ð¿Ð¾Ð³Ð¾Ð²Ð¾Ñим о пÑоÑÑÑÑ
, базовÑÑ
меÑодаÑ
пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¸ обÑабоÑки изобÑажений.
2 ЧÑÑно-белое изобÑажение
ÐÐ»Ñ Ð¼Ð½Ð¾Ð³Ð¸Ñ
Ð·Ð°Ð´Ð°Ñ Ð¾Ð±ÑабоÑки изобÑажений ÑÐ²ÐµÑ Ð½Ðµ игÑÐ°ÐµÑ Ð²Ð°Ð¶Ð½Ð¾Ð¹ Ñоли.
CамÑй пÑоÑÑой ÑпоÑоб кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑоÑки изобÑÐ°Ð¶ÐµÐ½Ð¸Ñ ÑÑо бинаÑнÑй (0,1), Ñ.е. ÑоÑка Ð¼Ð¾Ð¶ÐµÑ Ð½Ð°Ñ
одиÑÑÑÑ Ð² двÑÑ
ÑоÑÑоÑниÑÑ
ÑÑÑÐ½Ð°Ñ Ð¸Ð»Ð¸ белаÑ.
Ðолее ÑложнÑй ÑпоÑоб кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑÑо гÑадаÑии ÑеÑого (grayscale), ÑоÑÑоÑние ÑоÑки
опÑеделÑеÑÑÑ Ð¿Ð°ÑамеÑÑом ÑÑкоÑÑи, коÑоÑÑй пÑÐ¸Ð½Ð¸Ð¼Ð°ÐµÑ Ð·Ð½Ð°ÑÐµÐ½Ð¸Ñ Ð¾Ñ 0 до 255, Ñаким обÑазом
одна ÑоÑка Ð¼Ð¾Ð¶ÐµÑ ÐºÐ¾Ð´Ð¸ÑоваÑÑÑÑ Ð¾Ð´Ð½Ð¸Ð¼ байÑом.
|
|
ÐÑеобÑазоваÑÑ ÐºÐ°ÑÑÐ¸Ð½ÐºÑ Ð¸Ð· гÑадаÑии ÑеÑого в бинаÑнÑÑ Ð¼Ð¾Ð¶Ð½Ð¾ пÑоÑÑÑм поÑоговÑм
пÑеобÑазованием.
ÐÑÐ¾Ñ ÑпоÑоб годиÑÑÑÑ Ð´Ð»Ñ ÑавномеÑно оÑвеÑÑннÑÑ
ÑÑен, в пÑоÑивном ÑлÑÑае вÑбÑаÑÑ ÑдаÑнÑй
поÑог ÑÑкоÑÑи T Ð´Ð»Ñ Ð²Ñей каÑÑинки Ð¼Ð¾Ð¶ÐµÑ Ð¾ÐºÐ°Ð·Ð°ÑÑÑÑ Ð·Ð°ÑÑÑдниÑелÑно.
ÐÐ»Ñ ÑеÑÐµÐ½Ð¸Ñ ÑÑой задаÑи
можно иÑполÑзоваÑÑ Ð°Ð´Ð°Ð¿ÑивнÑй поÑог. ÐÐ»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ ÑоÑки ÑаÑÑмаÑÑиваеÑÑÑ ÐµÑ Ð¾ÐºÑеÑÑноÑÑÑ
и поÑог вÑбиÑаеÑÑÑ ÑолÑко Ð´Ð»Ñ ÑÑой окÑеÑÑноÑÑи, напÑÐ¸Ð¼ÐµÑ ÐºÐ°Ðº ÑÑеднÑÑ ÑÑкоÑÑÑ
окÑеÑÑноÑÑи.
|
|
|
3 ÐпеÑаÑии маÑемаÑиÑеÑкой моÑÑологии
РезÑлÑÑÐ°Ñ Ð¿Ð¾Ñогового пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð¾Ð¶ÐµÑ ÑодеÑжаÑÑ ÑÑм. ÐÐ»Ñ Ð±Ð¾ÑÑÐ±Ñ Ñ ÑÑими пÑоблемами
пÑименÑÑÑ Ð¾Ð¿ÐµÑаÑии маÑемаÑиÑеÑкой моÑÑологии. ÐÐ°Ð¶Ð´Ð°Ñ ÑоÑка иÑÑ
одного изобÑажениÑ
ÑаÑÑмаÑÑиваеÑÑÑ Ñ Ð½ÐµÐºÐ¾ÑоÑой окÑеÑÑноÑÑÑÑ. ФоÑма и ÑÐ°Ð·Ð¼ÐµÑ ÑÑой окÑеÑÑноÑÑи задаÑÑÑÑ Ñ.н.
ÑÑÑÑкÑÑÑнÑм ÑлеменÑом, в пÑоÑÑейÑем ÑлÑÑае ÑÑо квадÑÐ°Ñ ÑазмеÑа 3×3 ÑоÑки.
ÐÐ»Ñ Ð¾Ð±ÑабоÑки изобÑажений пÑименÑÑÑ Ð´Ð²Ðµ оÑновнÑе опеÑаÑии ÑÑжение и ÑаÑÑиÑение, а Ñакже иÑ
комбинаÑии.
- СÑжение (Erode) â аналог логиÑеÑкого Ð, ÑоÑка пÑÐ¸Ð½Ð¸Ð¼Ð°ÐµÑ Ð·Ð½Ð°Ñение 1 (белÑй) еÑли
вÑе ÑоÑки в окÑеÑÑноÑÑи белÑе. - РаÑÑиÑение (Dilate) â аналог логиÑеÑкого ÐÐÐ, ÑоÑка пÑÐ¸Ð½Ð¸Ð¼Ð°ÐµÑ Ð·Ð½Ð°Ñение 1
(белÑй) еÑли в окÑеÑÑноÑÑи еÑÑÑ Ñ Ð¾ÑÑ Ð±Ñ Ð¾Ð´Ð½Ð° Ð±ÐµÐ»Ð°Ñ ÑоÑка. - ÐакÑÑÑие (closing) â поÑледоваÑелÑное вÑполнение ÑаÑÑиÑÐµÐ½Ð¸Ñ Ð¸ ÑÑжениÑ.
- РаÑкÑÑÑие (opening) â поÑледоваÑелÑное вÑполнение ÑÑÐ¶ÐµÐ½Ð¸Ñ Ð¸ ÑаÑÑиÑениÑ.
|
|
|
|
|
4 ФилÑÑÑÑ
ÐÑименение ÑилÑÑÑа к изобÑÐ°Ð¶ÐµÐ½Ð¸Ñ ÑÑо изменение знаÑÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ пикÑÐµÐ»Ñ Ð² завиÑимоÑÑи
Ð¾Ñ ÐµÐ³Ð¾ окÑеÑÑноÑÑи, ÑÐ°Ð·Ð¼ÐµÑ Ð¾ÐºÑеÑÑноÑÑи ÑÑо паÑамеÑÑ, коÑоÑÑй назÑваÑÑ ÑазмеÑом
ÑилÑÑÑа.
CвÑÑÑоÑнÑй ÑилÑÑÑ Ð¸Ð»Ð¸ ÑвÑÑÑка ÑÑо ÑледÑÑÑее пÑеобÑазование.
где f — изобÑажение, g — ÑдÑо.
Т.е. беÑÑм ÑоÑÐºÑ Ñ Ð¾ÐºÑеÑÑноÑÑÑÑ, поÑлеменÑно Ñмножаем ÑÑÑ Ð¼Ð°ÑÑиÑÑ Ð½Ð° ÑдÑо, ÑезÑлÑÑаÑ
ÑÑммиÑÑеÑÑÑ Ð¸ запиÑÑваеÑÑÑ ÐºÐ°Ðº новое знаÑение данной ÑоÑки. ÐÑоÑедÑÑа повÑоÑÑеÑÑÑ Ð´Ð»Ñ Ð²ÑеÑ
ÑоÑек изобÑажениÑ.
ФилÑÑÑÑ Ð¾Ð±Ð»Ð°Ð´Ð°ÑÑ ÑÑдом полезнÑÑ
ÑвойÑÑв, напÑÐ¸Ð¼ÐµÑ ÐºÐ¾Ð¼Ð±Ð¸Ð½Ð°Ñии ÑилÑÑÑов, пÑименÑемÑÑ
к
изобÑажениÑ, коммÑÑаÑÐ¸Ð²Ð½Ñ Ð¸ аÑÑоÑиаÑивнÑ[1].
Ðалее пÑÐ¸Ð²ÐµÐ´ÐµÐ½Ñ Ð¿ÑимеÑÑ ÑилÑÑÑов
5 ÐÑделение кÑаÑв
ÐÐ»Ñ Ð°Ð½Ð°Ð»Ð¸Ð·Ð° изобÑажений можно пÑименÑÑÑ Ð¼ÐµÑÐ¾Ð´Ñ ÑабоÑÑ Ñ ÐºÐ¾Ð½ÑÑÑами.
ÐÑделив кÑÐ°Ñ Ð¸ Ð½Ð°Ð¹Ð´Ñ ÐºÐ¾Ð½ÑÑÑÑ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ Ð¼Ñ ÑÑÐ°Ð·Ñ Ð¾ÑбÑаÑÑваем лиÑнÑÑ Ð¸Ð½ÑоÑмаÑиÑ.
ÐÑÐ¾Ñ Ð¿Ð¾Ð´Ñ
од Ð¸Ð¼ÐµÐµÑ Ñвои недоÑÑаÑки, напÑÐ¸Ð¼ÐµÑ Ð¾Ð½ ÑÑвÑÑвиÑелен к ÑÑмÑ, но иногда Ñ ÐµÐ³Ð¾
помоÑÑÑ Ð¼Ð¾Ð¶Ð½Ð¾ полÑÑиÑÑ Ñ
оÑоÑий ÑезÑлÑÑаÑ.
ÐÑÐ°Ñ Ð½Ð° каÑÑинке ÑÑо облаÑÑи Ñезкого Ð¸Ð·Ð¼ÐµÐ½ÐµÐ½Ð¸Ñ ÑÑкоÑÑи. ÐÐ»Ñ Ð²ÑÐ´ÐµÐ»ÐµÐ½Ð¸Ñ ÐºÑаÑв обÑÑно
иÑполÑзÑеÑÑÑ Ð¼ÐµÑод Canny[1]. ÐÑÐ¾Ñ Ð¼ÐµÑод вÑполнÑÐµÑ ÑвеÑÑÐºÑ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ Ñ ÑдÑом [1 -1] (пÑÐ¾Ð¸Ð·Ð²Ð¾Ð´Ð½Ð°Ñ Ð¾Ñ ÑилÑÑÑа ÐаÑÑÑа),
опÑеделÑÐµÑ Ð³ÑÐ°Ð´Ð¸ÐµÐ½Ñ ÑÑкоÑÑи, ÑÑонÑÑÐ°ÐµÑ Ð¸ ÑвÑзÑÐ²Ð°ÐµÑ Ð¿Ð¾Ð»ÑÑивÑиеÑÑ ÐºÑаÑ.
|
|
6 ЦвеÑовÑе пÑоÑÑÑанÑÑва
РоÑлиÑии Ð¾Ñ ÑÑÑно-белÑÑ
изобÑажений, ÑоÑка ÑвеÑного изобÑÐ°Ð¶ÐµÐ½Ð¸Ñ Ð¾Ð±ÑÑно кодиÑÑеÑÑÑ ÑÑемÑ
паÑамеÑÑами (ÑÑиÑ
ÑомаÑиÑеÑÐºÐ°Ñ ÑеоÑиÑ), Ñаким обÑазом каÑÑинка пÑедÑÑавлÑеÑÑÑ ÐºÐ°Ðº ÑÑи
одноÑипнÑе маÑÑиÑÑ.
ÐаÑамеÑÑÑ, коÑоÑÑе назÑваÑÑ ÐºÐ°Ð½Ð°Ð»Ð°Ð¼Ð¸ изобÑажениÑ, можно вÑбиÑаÑÑ ÑазнÑми ÑпоÑобами.
наиболее извеÑÑнÑй — RGB (кÑаÑнÑй, зелÑнÑй, Ñиний), каждÑй из ÑÑÑÑ
паÑамеÑÑов RGB
кодиÑÑеÑÑÑ Ð¾Ð´Ð½Ð¸Ð¼ байÑом, Ñ.е. Ð¾Ñ 0 до 255.
Ðомимо RGB ÑÑÑеÑÑвÑÑÑ Ð¸ дÑÑгие ÑпоÑÐ¾Ð±Ñ ÐºÐ¾Ð´Ð¸ÑованиÑ, напÑÐ¸Ð¼ÐµÑ HSV (Hue, Saturation,
Value) â Ñон, наÑÑÑенноÑÑÑ, ÑÑкоÑÑÑ.
РиÑ.15: ÑвеÑÐ¾Ð²Ð°Ñ Ð¼Ð¾Ð´ÐµÐ»Ñ HSV [3]
ЦвеÑÐ¾Ð²Ð°Ñ Ð¼Ð¾Ð´ÐµÐ»Ñ HSV Ð¼Ð¾Ð¶ÐµÑ Ð¾ÐºÐ°Ð·Ð°ÑÑÑÑ Ð±Ð¾Ð»ÐµÐµ Ñдобной Ð´Ð»Ñ Ð¾Ð±ÑабоÑки Ñем RGB.
7 ÐеÑÐ¾Ð´Ñ ÐºÐ¾ÑÑекÑии ÑÑкоÑÑи и конÑÑаÑÑноÑÑи изобÑажениÑ
ÐÐ»Ñ ÑлÑÑÑÐµÐ½Ð¸Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ ÑÑÑеÑÑвÑÑÑ ÑледÑÑÑие пÑоÑÑÑе меÑодÑ.
7.1 ÐÐ¸Ð½ÐµÐ¹Ð½Ð°Ñ ÐºÐ¾ÑÑекÑиÑ
ÐÐ¸Ð½ÐµÐ¹Ð½Ð°Ñ ÐºÐ¾ÑÑекÑÐ¸Ñ (autolevels) â ÑаÑÑÑжение знаÑений ÑÑкоÑÑи ÑоÑек на веÑÑ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½ [0,255].
Autolevels позволÑÐµÑ ÑлÑÑÑиÑÑ ÐºÐ¾Ð½ÑÑаÑÑноÑÑÑ, ÑÑÐ¾Ñ Ð¼ÐµÑод не ÑабоÑÐ°ÐµÑ ÐµÑли на
каÑÑинке одновÑеменно пÑиÑÑÑÑÑвÑÑÑ Ð±ÐµÐ»Ñе (255) и ÑÑÑнÑе (0) пикÑели, в ÑÑом
ÑлÑÑае можно пÑименÑÑÑ Ð½ÐµÐ»Ð¸Ð½ÐµÐ¹Ð½ÑÑ (gamma) коÑÑекÑиÑ.
|
|
7.2 grayworld — вÑÑавнивание ÑÑедниÑ
ÐеÑод grayworld â вÑÑавнивание ÑÑÐµÐ´Ð½Ð¸Ñ Ð·Ð½Ð°Ñений по вÑем каналам ÑвеÑного изобÑажениÑ.
где n = 3 — колиÑеÑÑво каналов изобÑажениÑ, mj — ÑÑеднее знаÑение канала j, m — ÑÑеднее знаÑение по вÑем каналам
|
|
7.3 gamma-коÑÑекÑиÑ
ÐеÑод gamma-коÑÑекÑии ÑÑо нелинейное изменение ÑÑкоÑÑи по ÑледÑÑÑей ÑоÑмÑле.
I := c â Iγ
|
|
7.3 retinex — компенÑаÑÐ¸Ñ Ð½ÐµÑавномеÑного оÑвеÑениÑ
ÐеÑод retinex — компенÑаÑÐ¸Ñ Ð½ÐµÑавномеÑного оÑвеÑениÑ, пÑедÑÑавим каÑÑÐ¸Ð½ÐºÑ ÐºÐ°Ðº ÑледÑÑÑÑÑ ÐºÐ¾Ð¼Ð±Ð¸Ð½Ð°ÑиÑ.
I = R â L
где R — иÑÑ Ð¾Ð´Ð½Ð¾Ðµ изобÑажение, L — оÑвеÑение.
ÐолÑÑиÑÑ ÐºÐ°ÑÑÑ (пÑиближеннÑÑ) оÑвеÑÐµÐ½Ð¸Ñ Ð¼Ð¾Ð¶Ð½Ð¾ пÑименив ÑилÑÑÑ ÐаÑÑÑа (низкоÑаÑÑоÑнÑÑ ÑилÑÑÑаÑиÑ).
L’ = I * G
ÐÑиÑенное изобÑажение воÑÑÑанавливаеÑÑÑ Ð¿Ð¾ ÑледÑÑÑей ÑоÑмÑле.
log(R’) = log(I) — log(L’)
|
|
ÐÑÑ Ð¾Ð´Ð½Ñе ÑекÑÑÑ Ð¿ÑогÑамм [ здеÑÑ ].
СпиÑок лиÑеÑаÑÑÑÑ
[1] ÐнÑон ÐонÑÑин Ðведение в компÑÑÑеÑное зÑение â
https://www.lektorium.tv/course/22847
[2] OpenCV â https://opencv.org
[3] Wikipedia: HSV â https://ru.wikipedia.org
ÐÑи иÑполÑзовании маÑеÑиалов ÑÑого ÑайÑа, пожалÑйÑÑа вÑÑавлÑйÑе в Ñвой ÑекÑÑ ÑÑÑÐ»ÐºÑ Ð½Ð° Ð¼Ð¾Ñ ÑÑаÑÑÑ.
Источник
Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 00:02, 27 мая 2016.
Статья по учебной дисциплине | |
Название дисциплины: | Обнаружение и распознавание сигналов |
---|---|
Раздел: | 8. Распознавание и идентификация сигналов на физическом уровне |
Глава: | 8.1 Предварительная обработка изображений |
Преподаватель: | Чичварин Н. В. |
Яркость — световая характеристика тел. Отношение силы света, излучаемого поверхностью, к площади ее проекции на плоскости, перпендикулярной оси наблюдения.
Контрастность — различимость предмета наблюдения от окружающего его фона (монохроматическое излучение). Цветовая контрастность — разновидность оптической контрастности, связанная с разницей цветовых оттенков.
Коррекция яркости и контрастности изображений
Изображения зачастую являются малоконтрастными. Слабый контраст, как правило, обусловлен широким диапазоном воспроизводимых яркостей, нередко сочетающийся с нелинейностью характеристики передачи уровней. Характер зависимости изменения яркости палитры пикселей от минимального значения до максимального также влияет на качество изображения. Оптимальной является линейная функция изменения интенсивности пикселей. При вогнутой характеристике изображение будет более темным, при выпуклой — более светлым. И в том, и в другом случае признаки объектов могут быть искажены и недостаточно хорошо идентифицируемы. Коррекция (линеаризация) яркости палитры существенно улучшает качество изображения.
Малая контрастность может быть обусловлена и тем, что вариации функции яркости пикселей на изображении намного меньше допустимого диапазона шкалы яркостей. В этом случае контрастность изображения повышается путем «растягивания» реального динамического диапазона яркостей на всю шкалу при помощи линейного поэлементного преобразования.
Другой способ коррекции яркости палитры связан с инверсией входного изображения. Поскольку различать слабые сигналы на темном фоне достаточно сложно, то инверсная форма представления таких изображений имеет другую гистограмму яркостей, более приемлемую для наблюдения и визуальной идентификации.
Некоторые задачи обработки изображения связаны с преобразованием полутонового изображения (много градаций яркости) в бинарное (две градации). Преобразование осуществляется для того, чтобы сократить информационную избыточность изображения, оставить в нем только информацию, которая нужна для решения конкретной задачи. В бинарном изображении должны быть сохранены определенные детали (например, очертания изображенных объектов) и исключены несущественные особенности (фон).
Пороговая обработка полутонового изображения заключается в разделении всех элементов изображения на два класса и по признаку яркости с границей , и в выполнении соответствующей пороговой фильтрации с заменой пикселей изображения на установленную яркость классов. Выбор границы определяется видом гистограммы яркости исходного изображения. Для простейших изображений типа чертежей, машинописного текста и т.п., имеющих бимодальное распределение, граница устанавливается по минимуму между модами распределения. В общем случае изображение может быть многомодальным, и если устанавливается достаточно надежное соответствие между объектами и соответствующими модами их яркости, то пороговая фильтрация также может предусматривать несколько классов яркости пикселей.
Диапазон яркости изображения в компьютере может иметь отличия от диапазона яркостей исходного, например, в силу недостаточной экспозиции. Существует два возможных способа коррекции яркости. Согласно первому способу изображение линейно отображается в диапазоне яркостей исходного. Второй способ предусматривает ограничение яркости пикселей в обработанном изображении максимальным и минимальным пороговыми уровнями, и имеет более широкое применение. Присутствие в изображении самых светлых и самых темных тонов создает впечатление хорошей контрастности, однако излишняя контрастность приводит к тому, что максимальные градации влияют на средние тона, а большинство деталей изображения окрашены именно в средних тонах и излишняя контрастность может приводит к потере этих деталей или затруднить их выделение.
Гистограммы яркости
Инструментом для оценки уровней интенсивности пикселей является гистограмма — графическое отображение количественной характеристики вероятностного распределения интенсивности (яркости) пикселей в выделенном участке изображения. Максимальному значению интенсивности пикселей присваивается уровень градации интенсивности 255 (белый цвет), самому темному — значение 0 (черный цвет). Интенсивности в диапазоне от 0 до 255 имеют линейную шкалу изменения, либо устанавливаемую в соответствии с принятой функцией изменения, например, усиливающей слабые сигналы (градации серого) и ослабляющей сильные сигналы (в области белого цвета), чем повышается пространственное и контрастное разрешение изображения или определенной зоны интереса.
Известен метод улучшения изображений, основанный на вычислении логарифма спектральных коэффициентов преобразования Фурье исходного изображения (вычисление кепстра). При обратном преобразовании кепстра в изображение происходит выравнивание гистограммы изображения за счет логарифмического преобразования спектра изображения.
Многие изображения характеризуются гистограммами с высокой концентрацией линий в определенных зонах распределения интенсивности. Часто гистограмма распределения яркостей изображения имеет перекос в сторону малых уровней (яркость большинства элементов ниже средней). Одним из методов улучшения качества таких изображений является видоизменение их гистограммы. Выравнивание гистограммы может быть осуществлено на основе возведения в степень модуля спектральных коэффициентов Фурье-преобразования изображения, при этом знак и фаза коэффициентов сохраняется. Если обозначить показатель степени , то при операция извлечения корня степени уменьшает большие спектральные коэффициенты и увеличивает малые. Такое перераспределение энергии в частотной плоскости изображения приводит к более эффективному использованию динамического диапазона интенсивностей пикселей изображения в пространственной области.
Выбор хорошей маски регулирования гистограммы интенсивности пикселей повышает контраст, тем самым улучшая контрастную разрешающую способность деталей. В программах обработки есть команды, позволяющие устанавливать цвета при цветном картировании изображений, имеющие плавные или, наоборот, резкие переходы отображаемых деталей в зоне интереса. В сочетании с обращением контраста, преобразующем негативное изображение в позитивное, данный способ позволяет также повысить контраст мелких и средних деталей изображения.
Существует достаточно большой арсенал математических моделей и алгоритмов, программная реализация которых позволяет значительно повысить контрастное разрешение изображений. Эти алгоритмы основаны на процессах линейной и нелинейной фильтрации изображений, преобразующей гистограмму интенсивности.
Выравнивание освещенности изображений
Часто некоторые участки на изображении бывают слишком темными, чтобы на них можно было что-то разглядеть. Если прибавить яркости ко всему изображению, то изначально светлые участки могут оказаться засвеченными. Чтобы улучшить вид изображения в таких случаях, применяется метод выравнивания освещенности.
Освещенность меняется в пространстве достаточно медленно и ее можно считать низкочастотным сигналом. Само же изображение можно считать в среднем более высокочастотным сигналом. Если бы в процессе фотографии эти сигналы складывались, то их можно было бы разделять с помощью обычных фильтров. Однако на реальной фотографии получается произведение той картины, которую мы хотим видеть, и карты освещенности. И поскольку эти сигналы не складываются, а перемножаются, то избавиться от неравномерностей освещенности простой фильтрацией не удастся.
Для решения таких задач применяется гомоморфная обработка. Идея обработки заключается в сведении нелинейной задачи к линейной. Например, можно свести задачу разделения перемноженных сигналов к задаче разделения сложенных сигналов. Для этого нужно взять логарифм от произведения изображений, который будет равен сумме логарифмов сомножителей. При этом задача разделения произведения сигналов сводится к задаче разделения суммы НЧ- и ВЧ- сигналов и решается с помощью ВЧ-фильтра, который удалит из суммы сигналов низкие частоты. Останется взять от полученного сигнала экспоненту, чтобы вернуться к исходному масштабу амплитуд.
ВЧ-фильтр можно реализовать следующим образом. Сначала к изображению применяется операция размытия (НЧ-фильтр), а потом из исходного изображения вычитается размытое. Наилучший радиус размытия зависит от конкретного изображения. Можно начать эксперименты с радиуса порядка десяти пикселей.
Обычно для размытия изображения применяется двумерный гауссовский фильтр, имеющий вид . Здесь – нормирующая константа (сумма всех коэффициентов фильтра должна быть равна 1), – «ширина» фильтра, регулирующая степень размытия.
Непосредственное вычисление двумерной свертки с таким ядром требует больших вычислений даже при сравнительно небольшом размере ядра. Однако эквивалентного эффекта можно достичь, отфильтровав одномерным гауссианом сначала строки изображения, а затем столбцы полученного изображения. Полученный от выравнивания освещенности эффект может оказаться слишком сильным (темные области станут по яркости такими же, как и светлые). Чтобы уменьшить эффект, можно просто смешать обработанное изображение с исходным в определенной пропорции.
Улучшение пространственного разрешения
Интерпретация изображений тесно связана с качеством представления мелких неискаженных деталей. При этом необходимо, чтобы с увеличением фрагментов не происходило ухудшения разрешающей способности изображения при выполнении математических операций 2D-интерполяции функции пространственного распределения интенсивности пикселей в строках и столбцах матрицы изображения. Важным фактором при идентификации объектов является также локализация и отображение зон одной и той же яркости или цветности, даже если эти области имеют размеры нескольких пикселей.
Четкость изображений в профессиональных программах корректируется, как правило, определением оптимальных значений яркости и контрастности путем выбора соответствующих опций:
- «величины» — степени влияния воздействия на резкость изображения;
- «радиуса» — толщины контура резкости;
- «порога дискриминации» — определения контуров объектов путем задания разности значений интенсивности соседних пикселей, достаточной для того, чтобы программа повысила контрастность между ними.
Некоторые программы содержат автоматическую установку оптимального соотношения контрастности и яркости, поддерживающих необходимую четкость изображения.
При обработке изображений важную роль играют алгоритмы ранговой фильтрации, позволяющие устранять «размытость» деталей (улучшить их фокусировку) за счет выбора двумерной маски пикселей, выполнения операции ранжирования значений интенсивности пикселей в пределах задаваемой маски и присвоения центральному пикселю значения, равного максимальному значению по ранжиру. К виду ранговой относится также процедура медианной фильтрации, устраняющая в изображении некоррелированные случайные сигналы и импульсные помехи без «размытия» резких перепадов яркости на границах объектов.
Применение линейной фильтрации обусловлено ее возможностями коррекции искажений различного типа, возникающих вследствие несовершенства устройств, формирующих изображение. Посредством линейной фильтрации удается уменьшить влияние флуктуационных шумов и других дефектов на воспроизводимых изображениях в режиме повышения контраста малоконтрастных деталей при увеличении масштаба зон интереса.
Коррекция аппертурных искажений изображений в случае отсутствия шумовой составляющей сигнала осуществляется путем инверсной фильтрации (деконволюции). Однако следует учитывать, фильтры деконволюции имеют коэффициент усиления дисперсии шумов, больший 1, и вместо улучшения изображения может увеличиться зашумленность.
Перспективными считаются нелинейные методы фильтрации на основе частотных масок, позволяющих уменьшить влияние низкочастотных компонент сигнала изображения и усилить влияние высокочастотных компонент, что повышает пространственное разрешение деталей, описываемых в спектре изображения более высокими пространственными частотами.
Поиск границ на основе градиента
В дополнении к уже рассмотренным методам сегментации рассмотрим способ выделения границ путем пространственного дифференцирования функции распределения яркости. Для двумерной функции яркости перепады в направлениях и регистрируются частными производными и , которые пропорциональны скоростям изменения яркости в соответствующих направлениях.
Выделение перепадов яркости иллюстрирует рис.1. На нем можно видеть, что подчеркивание контуров, перпендикулярных к оси , обеспечивает производная (рис. 1б), а подчеркивание контуров, перпендикулярных к оси , – (рис. 1в).
В практических задачах требуется выделять контуры, направление которых является произвольным. Для этих целей можно использовать модуль градиента функции яркости
который пропорционален максимальной (по направлению) скорости изменения функции яркости в данной точке и не зависит от направления контура. Модуль градиента в отличие от частных производных принимает только неотрицательные значения, поэтому на получающемся изображении (рис. 1г) точки, соответствующие контурам, имеют повышенный уровень яркости.
Для цифровых изображений аналогами частных производных и модуля градиента являются разностные функции.
Практический пример выделения границ на фотоизображении приведен на рис.2. Исходное изображение (1) является достаточно однотонным. На изображении (2) представлен результат вычисления вектора градиента яркости . Как видно на рисунке, в точках большого перепада яркости градиент имеет большую длину. Отфильтровав пиксели с длиной градиента, большей определенного порога , мы получим изображение границ (3).
Недостаток алгоритма — пропуск границы с малыми перепадами яркости и включение в число границ деталей изображения с большими изменениями яркости (шкурка бурундука). При зашумлении изображения карту граничных точек будут загрязнять и просто шум, поскольку не учитывается, что граничные точки соответствуют не просто перепадам яркости, а перепадам яркости между относительно монотонными областями.
Для снижения влияния данного недостатка изображение сначала подвергают сглаживающей гауссовской фильтрации. При сглаживающей фильтрации мелкие несущественные детали размываются быстрее перепадов между областями. Результат операции можно видеть на изображении (4). Однако при этом расплываются в жирные линии четко выраженные границы.
Градиент яркости в каждой точке характеризуется длиной и направлением. Выше при поиске граничных точек использовалась только длину вектора. Направление градиента — это направление максимального возрастания функции, что позволяет использовать процедуру подавления немаксимумов. При этой процедуре для каждой точки рассматривается отрезок длиной в несколько пикселей, ориентированный по направлению градиента и с центром в рассматриваемом пикселе. Пиксель считается максимальным тогда и только тогда, когда длина градиента в нем максимальна среди всех длин градиентов пикселей отрезка. Граничными можно признать все максимальные пиксели с длинами градиента больше определенного порога. Градиент яркости в каждой точке перпендикулярен границе, поэтому после подавления немаксимумов жирных линий не остается. На каждом перпендикулярном сечении жирной линии останется один пиксель с максимальной длиной градиента.
Перпендикулярность градиента яркости к границе может быть использована для прослеживания границы, начиная с некоторого граничного пикселя. Такое прослеживание используется в гистерезисной фильтрации максимальных пикселей. Идея гистерезисной фильтрации заключается в том, что длинный устойчивый граничный контур, скорее всего, содержит в себе пиксели с особенно большим перепадом яркости, и, начиная с такого пикселя, контур можно проследить, переходя по граничным пикселям с меньшим перепадом яркости.
При проведении гистерезисной фильтрации вводят не одно, а два пороговых значения. Меньшее () соответствует минимальной длине градиента, при которой пиксель может быть признан граничным. Большее (), соответствует минимальной длине градиента, при которой пиксель может инициализировать контур. После того как контур инициализируется в максимальном пикселе с длиной градиента, большей , рассматриваются каждый соседний с ним максимальный пиксель . Если пиксель имеет длину градиента, большую , и угол между векторами и близок к то добавляется к контуру, и процесс рекурсивно переходит к . Его результат для исходного изображения на рис.2 показан на рис.3.
Таким образом, алгоритм нахождения границ на основе градиента заключается в последовательном применении следующих операций:
- гауссовская сглаживающая фильтрация;
- нахождение градиента яркости в каждом пикселе;
- нахождение максимальных пикселей;
- гистерезисная фильтрация максимальных пикселей.
Этот алгоритм носит названия алгоритма Кэнни и наиболее часто применяется для нахождения границ.
Поиск границ на основе лапласиана
Известно, что необходимым и достаточным условием экстремального значения первой производной функции в произвольной точке является равенство нулю второй производной в этой точке, причем вторая производная должна иметь разные знаки по разные стороны от точки.
В двумерном варианте аналогом второй производной является лапласиан — скалярный оператор .
Нахождение границ на изображении с использованием лапласиана может производиться по аналогии с одномерным случаем: граничными признаются точки, в которых лапласиан равен нулю и вокруг которых он имеет разные знаки. Оценка лапласиана при помощи линейной фильтрации также предваряется гауссовской сглаживающей фильтрацией, чтобы снизить чувствительность алгоритма к шуму. Гауссовское сглаживание и поиск лапласиана можно осуществить одновременно, поэтому нахождение границ при помощи такого фильтра производится быстрее, чем при помощи алгоритма Кэнни. Фильтр применяется в системах, где имеет значение и качество результата (обычно уступает алгоритму Кэнни), и быстродействие. Чтобы уменьшить чувствительность к несущественным деталям, из числа граничных точек также можно исключить те, длина градиента в которых меньше определенного порога (рис.4).
См. также
Источник