Blog posts

2024

OCR for Korean language

less than 1 minute read

Published:

What is OCR (Optical Character Recognition)?

Explain Stable Diffusion

1 minute read

Published:

생성형 AI에 문장을 만들어 내는 text generation, 그림을 만들어 내는 image genration, 음성/음악을 만들어내는 wave generation이 있다. 그 중 이미지 생성에 관해서는 문장으로부터 이미지를 만들어 내는 text to image 알고리즘과 하나의 이미지로부터 다른 이미지를 만들어 내는 image to image 알고리즘, 그림으로부터 관련된 문장을 만들어 내는 image to text 알고리즘, 마지막으로 그림에 특정 부분을 생성해서 채워주는 Inpainting 알고리즘이 있다. 특히나 문장으로부터 이미지를 생성해 주는 알고리즘이 많은 연구가 진행되고 있는데, 가장 유명한 알고리즘 혹은 서비스로 Midjourney, Dall-E, Stable Diffusion 등이 있다. 이 글에서는 Stable Diffusion XL 알고리즘에 대해 배워보고 그 구성요소를 이해함으로써 어떻게 prompt를 만들어서 원하는 것에 가까운 결과를 얻을 수 있을지 이야기해 보자.

2023

MLOps Engineering: Curriculum for Success

3 minute read

Published:

MLOps, or Machine Learning Operations, is a crucial field that focuses on streamlining the process of building, deploying, and maintaining machine learning models in production environments. As an MLOps engineer, you’ll need to have a strong understanding of various technologies, tools, and methodologies to be successful in your role. Here’s a comprehensive curriculum that covers all the essential topics for becoming an effective MLOps engineer:

Large Language Model Evaluation Metrics

1 minute read

Published:

Large language models are evaluated using various metrics to measure their performance. Some of the most common evaluation metrics include:

2022

Install cuda and cuDNN on home machine

1 minute read

Published:

To learn the deep learning algorithms, I changed my home computer into dual boot machine with windows 10 and pop! os 22.04

Setup PlaidML on macbook

1 minute read

Published:

PlaidML은 nvidia GPU를 사용할 수 없을때 deep learning neural network를 빠르게 훈련시키고 추론하는데 사용하는 라이브러리이다. 최근 뉴스로는 macbook m1 chip에서 pytorch, tensorflow등이 GPU로 바로 작동한다고 하는데, 그 이전에 AMD GPU나 Intel GPU등에서 사용할 수 있는 라이브러리이다. 단점으로는 예전 버전의 keras에 연동되어 있는데, 기본적인 공부를 하는데에는 무리없이 사용할 수 있을 것 같다. keras가 처음 머신러닝이 입문하는데 가장 편한 라이브러리 인 것 같다.

[0] Set up the machine learning system

1 minute read

Published:

머신 러닝 여행을 떠나기에 앞서 가장 먼제 해야 할 것은 ML 알고리즘을 돌려볼 수 있는 환경을 갖추는 것일 것이다. 여기에는 크게 세가지 요소가 작용하는데, 컴퓨터 하드웨어와 운영 체계, 그리고 ML 소프트웨어에 따라 이후의 설치 방법이 달라지게 된다. 가장 많이 사용되는 것들에 따라 하나씩 살펴 봅시다.

2018

install R 3.5 on ubuntu 16.04

1 minute read

Published:

Currently the default version of R in ubuntu 16.04 is 3.4. Some packages in bioconductor shows error messages on R 3.4 version.

어떻게 원수를 사랑할 수 있나?

1 minute read

Published:

마태복음 5장에는 산상 수훈이 나오고 이후로 예수님의 가르침이 나온다. 예수님의 가르치심과 권하는 행위는 당시로서는 파격적인 것이었는데, 율법에서 정한 것보다 훨씬 사랑과 용서를 강조하는 것이었다. 원수를 사랑하고 간음하지 말며, 형제와 화목하고 아내를 버리지 말며 맹세하지 말고 이웃을 내몸처럼 사랑하라는 가르침이 었다. 이러한 가르침은 율법에서 제시하는 것보다 훨씬 자기 희생과 사랑을 강조하는 내용이었는데, 심지어 사람이 과연 그렇게 할 수 있을까라는 생각이 드는 것들 이었다.

나는 누구인가?

1 minute read

Published:

나는 누구인가? 그들이 종종 말하기를 나는 감방에서 걸어 나올 때 마치 지주가 자기 저택에서 나오듯 침착하고, 쾌활하고, 당당하다고 한다.

소명에 대한 생각들

4 minute read

Published:

인생의 의미에 대해 묻기 시작하면서 늘 내 속에 가지고 있는 고민이 있다. 나는 인생을 잘 살고 있는가? 과연 내가 하고 있는 일은 의미가 있는 일인가? 내 재능을 제대로 활용하고 살고 있는가? 해야 하는 일이 잘 되지 않을때 나는 과연 재능이 있고 이 일을 하는 것이 맞는가?라는 생각이 들곤 한다. 40대가 되어 가면서 내가 살아온 인생을 되돌아 보게 되고 동시에 앞으로 살아갈 날을 생각하게 된다. 어떤 모습으로 살아야 하는가? 무엇을 하면서 살아야 하는가? 고민하게 된다. 그러한 고민을 가지고 살아 가면서 몸이 아프고 하는 일이 재미가 없게 되면 진지하게 왜 삶을 사는가 생각이 들게 된다. 이러한 일련의 감정들이 소명이라는 책을 다시 집어 들게 만들었고 진지하게 읽게 되었다.

내가 늙었을 때 명심해야 할 일

less than 1 minute read

Published:

걸리버 여행기의 저자 조나선 스위프트가 쓴 글로 하나 하나 읽다 보면 고령자들이 느끼는 피해 의식과 역으로 젊은 세대가 잘 새겨야 할 어르신들의 심리를 표현하고 있다.

천천히 생각하기

1 minute read

Published:

업무 효율을 높이기 위한 여러가지 방법들에 대해 생각해 볼 기회가 있었는데, 최근 읽은 책에서 영감을 받은 생각 중에 한 가지는 오히려 목표를 확실히 하라라는 조언이었다. 무엇을 하고 싶은가? 무엇을 이루고 싶은가? 이것을 확실히 하면 나머지 것들은 그것에 맞추어 따라 온다는 것이다. 지금 내 상황을 보면 끝마치지 못한 project들이 10개도 넘는다. 이렇게 많은 프로젝트를 한꺼번에 벌려 놓으면 늘어지기가 쉽고 그 결과 집중력이 떨어진다. 결국에는 각각의 프로젝트를 마치지 못한 하는 일이 생기기 쉽다.

2017

DNA in DLD

1 minute read

Published:

고분자 화합물은 용액 상태에서 random walker로 표현될 수 있는 무질서한 운동을 하고 있고 configuration을 가지고 있다. 이를 표현한 것이 worm-like-chain 모델이고 보통 sphere와 spring으로 이어진 모델로 설명을 하곤 한다.

자주 하는 작업들

1 minute read

Published:

컴퓨터 앞에 앉아서 하는 일들을 잘 생각해 보자. 주로 문제 해결 과정인데, 그것을이 머리속에서 너무 한꺼번에 빠른 속도로 일어나므로 잘 정리하지 않으면 오히려 개선하기가 쉽지 않다. 그러므로 일어나는 일들을 분석하고 자주 하는 일들을 정리하면 생산성 향상을 이룰 수 있다.

하루 한 문장 글쓰기

1 minute read

Published:

머리 속이 복잡하다. 이것 저것 할 일들도 많고 정리할 것들도 많아서 인 것 같다.

2009

2D position detect method

1 minute read

Published:

어제 찬우랑 식사중에 이야기를 듣고서 좋은 아이디어가 생각이 났다. 결국 2D image상의 패턴에서 위치를 찾아내는 함수는 이상적인 function을 만들고 그것을 2D상에서 이리저리 굴려서 가장 실제 결과에 가까운 함수를 찾아내면 되는 것이다. 이 경우 위치뿐만이 아니라 radius의 관한 정보도 얻을수 있게 된다. 즉

Systematic error of position detection

1 minute read

Published:

마이크로스코프 이미지에서 얻을수 있는 정보는 무엇인가? 1차적으로는 512×512 pixel에 담긴 빛의 양의 수치이다. 16bit에서는 0부터 2^16(=65536)까지의 숫자로 나타나고 14bit에서는 2^14까지 표현된다. 2차적으로는 보고자하는 물체의 위치와 모양을 알아낼수 있다. 사실 이 위치와 모양을 알아내는 것은 쉬운일이 아니다. 내가 알아내려고 하는 systematic error는 초기 1차적 정보에서 나올수도 있고 2차적 정보에서 나올수도 있다. 또한 0차적으로는 보고자하는 물체의 vibration으로 부터 나오기도 한다.