도커 크롬 드라이버를 설치하여, 웹 화면 셀레니움으로 headless 크롬 브라우저에서 한글 텍스트가 깨지는 이슈
시스템 2024. 10. 17. 00:56크롤링을 위해 우분투 도커 서버에 크롬 드라이버를 설치하고, 셀레니움으로 headless 크롬 브라우저로, 네이버 화면을 랜더링하고 캡처 이미지를 저장할 때, 저장된 캡처 이미지에서 한글 텍스트가 랜더링이 되지 않고 빈 박스 형태로 깨지는 이슈가 발생하였습니다.
headless 크룸 브라우저는 서버 환경과 같이 GUI 환경이 아닌 운영체제에서도 크롬 브라우저를 가상으로 랜더링하여, 웹 페이지를 그려주는 기능을 가지고 있습니다.
하지만 우분투 도커에서는 한글 텍스트가 정상적으로 랜더링 되지 않고, 깨지는 이슈가 생기고 있습니다.
해당 이슈에 대한 추측으로는 우분투 도커 환경에서 한글 폰트를 지원하지 않아, 크롬 브라우저에서 랜더링에 실패 했을 것으로 보고. 서버 환경에서 한글 폰트를 지원하는지 확인하였으나, 한글을 지원하고 있다는 것을 알았습니다.
해당 이슈에 대한 추가적인 자료를 검색하기 위해, ‘셀레니움 headless 한글 깨짐’과 관련된 주제의 글을 조사하였고, 특정 폰트가 필요하다는 것을 찾았습니다.
셀레니움 크룸 브라우저에서는 fonts-unfonts-core 폰트가 필요하며, 해당 폰트를 apt-get으로 설치하여 문제를 해결했습니다.
윈도우 응용 프로그램 코드 서명 (0) | 2025.02.12 |
---|---|
웹 크롤링 시스템 아이디어 (0) | 2024.10.24 |
환경 구성 (0) | 2024.07.20 |
도커 메뉴얼 (0) | 2024.07.20 |
프로그램 초기화와 오류 수정 로직 (0) | 2024.01.29 |