OCR for Korean language

less than 1 minute read


What is OCR (Optical Character Recognition)?

Explain Stable Diffusion

1 minute read


생성형 AI에 문장을 만들어 내는 text generation, 그림을 만들어 내는 image genration, 음성/음악을 만들어내는 wave generation이 있다. 그 중 이미지 생성에 관해서는 문장으로부터 이미지를 만들어 내는 text to image 알고리즘과 하나의 이미지로부터 다른 이미지를 만들어 내는 image to image 알고리즘, 그림으로부터 관련된 문장을 만들어 내는 image to text 알고리즘, 마지막으로 그림에 특정 부분을 생성해서 채워주는 Inpainting 알고리즘이 있다. 특히나 문장으로부터 이미지를 생성해 주는 알고리즘이 많은 연구가 진행되고 있는데, 가장 유명한 알고리즘 혹은 서비스로 Midjourney, Dall-E, Stable Diffusion 등이 있다. 이 글에서는 Stable Diffusion XL 알고리즘에 대해 배워보고 그 구성요소를 이해함으로써 어떻게 prompt를 만들어서 원하는 것에 가까운 결과를 얻을 수 있을지 이야기해 보자.

MLOps Engineering: Curriculum for Success

3 minute read


MLOps, or Machine Learning Operations, is a crucial field that focuses on streamlining the process of building, deploying, and maintaining machine learning models in production environments. As an MLOps engineer, you’ll need to have a strong understanding of various technologies, tools, and methodologies to be successful in your role. Here’s a comprehensive curriculum that covers all the essential topics for becoming an effective MLOps engineer:

Large Language Model Evaluation Metrics

1 minute read


Large language models are evaluated using various metrics to measure their performance. Some of the most common evaluation metrics include:

Install cuda and cuDNN on home machine

1 minute read


To learn the deep learning algorithms, I changed my home computer into dual boot machine with windows 10 and pop! os 22.04

Setup PlaidML on macbook

1 minute read


PlaidML은 nvidia GPU를 사용할 수 없을때 deep learning neural network를 빠르게 훈련시키고 추론하는데 사용하는 라이브러리이다. 최근 뉴스로는 macbook m1 chip에서 pytorch, tensorflow등이 GPU로 바로 작동한다고 하는데, 그 이전에 AMD GPU나 Intel GPU등에서 사용할 수 있는 라이브러리이다. 단점으로는 예전 버전의 keras에 연동되어 있는데, 기본적인 공부를 하는데에는 무리없이 사용할 수 있을 것 같다. keras가 처음 머신러닝이 입문하는데 가장 편한 라이브러리 인 것 같다.

[0] Set up the machine learning system

1 minute read


머신 러닝 여행을 떠나기에 앞서 가장 먼제 해야 할 것은 ML 알고리즘을 돌려볼 수 있는 환경을 갖추는 것일 것이다. 여기에는 크게 세가지 요소가 작용하는데, 컴퓨터 하드웨어와 운영 체계, 그리고 ML 소프트웨어에 따라 이후의 설치 방법이 달라지게 된다. 가장 많이 사용되는 것들에 따라 하나씩 살펴 봅시다.

install R 3.5 on ubuntu 16.04

1 minute read


Currently the default version of R in ubuntu 16.04 is 3.4. Some packages in bioconductor shows error messages on R 3.4 version.

어떻게 원수를 사랑할 수 있나?

1 minute read


마태복음 5장에는 산상 수훈이 나오고 이후로 예수님의 가르침이 나온다. 예수님의 가르치심과 권하는 행위는 당시로서는 파격적인 것이었는데, 율법에서 정한 것보다 훨씬 사랑과 용서를 강조하는 것이었다. 원수를 사랑하고 간음하지 말며, 형제와 화목하고 아내를 버리지 말며 맹세하지 말고 이웃을 내몸처럼 사랑하라는 가르침이 었다. 이러한 가르침은 율법에서 제시하는 것보다 훨씬 자기 희생과 사랑을 강조하는 내용이었는데, 심지어 사람이 과연 그렇게 할 수 있을까라는 생각이 드는 것들 이었다.

나는 누구인가?

1 minute read


나는 누구인가? 그들이 종종 말하기를 나는 감방에서 걸어 나올 때 마치 지주가 자기 저택에서 나오듯 침착하고, 쾌활하고, 당당하다고 한다.

소명에 대한 생각들

4 minute read


인생의 의미에 대해 묻기 시작하면서 늘 내 속에 가지고 있는 고민이 있다. 나는 인생을 잘 살고 있는가? 과연 내가 하고 있는 일은 의미가 있는 일인가? 내 재능을 제대로 활용하고 살고 있는가? 해야 하는 일이 잘 되지 않을때 나는 과연 재능이 있고 이 일을 하는 것이 맞는가?라는 생각이 들곤 한다. 40대가 되어 가면서 내가 살아온 인생을 되돌아 보게 되고 동시에 앞으로 살아갈 날을 생각하게 된다. 어떤 모습으로 살아야 하는가? 무엇을 하면서 살아야 하는가? 고민하게 된다. 그러한 고민을 가지고 살아 가면서 몸이 아프고 하는 일이 재미가 없게 되면 진지하게 왜 삶을 사는가 생각이 들게 된다. 이러한 일련의 감정들이 소명이라는 책을 다시 집어 들게 만들었고 진지하게 읽게 되었다.

내가 늙었을 때 명심해야 할 일

less than 1 minute read


걸리버 여행기의 저자 조나선 스위프트가 쓴 글로 하나 하나 읽다 보면 고령자들이 느끼는 피해 의식과 역으로 젊은 세대가 잘 새겨야 할 어르신들의 심리를 표현하고 있다.

천천히 생각하기

1 minute read


업무 효율을 높이기 위한 여러가지 방법들에 대해 생각해 볼 기회가 있었는데, 최근 읽은 책에서 영감을 받은 생각 중에 한 가지는 오히려 목표를 확실히 하라라는 조언이었다. 무엇을 하고 싶은가? 무엇을 이루고 싶은가? 이것을 확실히 하면 나머지 것들은 그것에 맞추어 따라 온다는 것이다. 지금 내 상황을 보면 끝마치지 못한 project들이 10개도 넘는다. 이렇게 많은 프로젝트를 한꺼번에 벌려 놓으면 늘어지기가 쉽고 그 결과 집중력이 떨어진다. 결국에는 각각의 프로젝트를 마치지 못한 하는 일이 생기기 쉽다.


1 minute read


고분자 화합물은 용액 상태에서 random walker로 표현될 수 있는 무질서한 운동을 하고 있고 configuration을 가지고 있다. 이를 표현한 것이 worm-like-chain 모델이고 보통 sphere와 spring으로 이어진 모델로 설명을 하곤 한다.

자주 하는 작업들

1 minute read


컴퓨터 앞에 앉아서 하는 일들을 잘 생각해 보자. 주로 문제 해결 과정인데, 그것을이 머리속에서 너무 한꺼번에 빠른 속도로 일어나므로 잘 정리하지 않으면 오히려 개선하기가 쉽지 않다. 그러므로 일어나는 일들을 분석하고 자주 하는 일들을 정리하면 생산성 향상을 이룰 수 있다.

하루 한 문장 글쓰기

1 minute read


머리 속이 복잡하다. 이것 저것 할 일들도 많고 정리할 것들도 많아서 인 것 같다.

2D position detect method

1 minute read


어제 찬우랑 식사중에 이야기를 듣고서 좋은 아이디어가 생각이 났다. 결국 2D image상의 패턴에서 위치를 찾아내는 함수는 이상적인 function을 만들고 그것을 2D상에서 이리저리 굴려서 가장 실제 결과에 가까운 함수를 찾아내면 되는 것이다. 이 경우 위치뿐만이 아니라 radius의 관한 정보도 얻을수 있게 된다. 즉

Systematic error of position detection

1 minute read


마이크로스코프 이미지에서 얻을수 있는 정보는 무엇인가? 1차적으로는 512×512 pixel에 담긴 빛의 양의 수치이다. 16bit에서는 0부터 2^16(=65536)까지의 숫자로 나타나고 14bit에서는 2^14까지 표현된다. 2차적으로는 보고자하는 물체의 위치와 모양을 알아낼수 있다. 사실 이 위치와 모양을 알아내는 것은 쉬운일이 아니다. 내가 알아내려고 하는 systematic error는 초기 1차적 정보에서 나올수도 있고 2차적 정보에서 나올수도 있다. 또한 0차적으로는 보고자하는 물체의 vibration으로 부터 나오기도 한다.



Optical tweezers as a micromechanical tool for studying defects in 2D colloidal crystals

Published in In the proceedings of Optical Trapping and Optical Micromanipulation VIII, 2011

1) Vacancy-interstitial pairs can be long-lived but annihilate each other.
2) Tri-vacancies exhibit fluctuating behavior between bound dislocation pairs and local amorphous states.
3) These observations have implications for understanding the nature of 2D melting.

Nanosensors for next generation drug screening

Published in In the proceedings of Micro/Nano Materials, Devices, and Systems, 2013

1) The study focuses on evaluating drug screening technologies using protein translocation through nanopores.
2) It uses large-scale, atomistic simulations to compare expected and simulated current drop values.
3) The research is in the context of developing high-throughput, low-cost drug screening devices by combining nanofabrication and microfluidics techniques.

Sensing of protein molecules through nanopores: a molecular dynamics study

Published in Nanotechnology, 2014

1) Protein translocation through nanopores can be simulated using atomistic molecular dynamics.
2) The change in blockade current and friction coefficient depends on the position of the protein within the pore.
3) The shape of the pore influences the variation in current with position, while confinement affects the friction coefficient of the protein.

Geometric dependence of the conductance drop in a nanopore due to a particle

Published in Phys. Rev. E, 2014

1) The effect of a neutral particle on ionic flow through nanopores can be studied using uniform field theory and PNP-NS equations.
2) Pore shape influences current changes due to particles, with both hourglass and cylindrical profiles showing differences.
3) Simple theories may not accurately capture access resistance changes when particles are at the pore entrance, and electro-osmotic flow can be disrupted by large particles.

Broken flow symmetry explains the dynamics of small particles in deterministic lateral displacement arrays

Published in Proceedings of the National Academy of Sciences, 2017

1) A unified theoretical framework is introduced to explain the trajectories of different-sized particles in DLD.
2) The framework can be used to design arrays for size fractionation, even at nanoscales.
3) Experimental verification confirms the accuracy of the predictions made by the framework, and a condenser structure with full particle separation is developed using this model.

Bio-inspired silicon nanospikes fabricated by metal-assisted chemical etching for antibacterial surfaces

Published in Applied Physics Letters, 2017

1) A new, cost-effective and scalable method has been developed for creating antibacterial surfaces using metal-assisted chemical etching on single crystal silicon substrates.
2) The process involves etching in a mixture of silver nitrate and hydrofluoric acid for 6 minutes to create optimal nanospikes with bactericidal properties.
3) The resulting surfaces exhibit strong antimicrobial activity against various bacteria, offering potential applications in antibacterial technologies.

Dynamical processes of interstitial diffusion in a two-dimensional colloidal crystal

Published in Proceedings of the National Academy of Sciences, 2020

1) Point defects, such as vacancies and interstitials, play an important role in the thermodynamics of 2D solids.
2) Interstitial diffusion constants are larger than those of vacancies, with diinterstitials being slower than monointerstitials.
3) Equilibrium behavior is observed for mono-interstitials, while local melting is suggested for di-interstitials, opening up opportunities for microscopic studies on the dynamics of melting in colloidal model systems.

Advancements in Throughput, Lifetime, Purification, and Workflow for Integrated Nanoscale Deterministic Lateral Displacement

Published in Advanced Materials Technologies, 2021

1) i-nanoDLD technology addresses nanoDLD's previous limitations with high efficiency and performance.
2) The development of an integrated design and increased parallelization results in a higher target colloid concentration and removal of contaminants from samples.
3) Upstream filter bank integration extends operation lifetime and allows for straightforward chip-to-world interfacing, making the technology suitable for research and clinical applications.

The Fermi-Dirac distribution provides a calibrated probabilistic output for binary classifiers

Published in Proceedings of the National Academy of Sciences, 2021

1) The proposed method maps the probability of correct classification to the Fermi-Dirac distribution, enabling computation of optimal thresholds and statistical parameters;
2) The relationship between classification probabilities and the Fermi-Dirac distribution allows for calibrated probabilistic outputs in binary classifiers;
3) FiDEL, an ensemble learning algorithm, utilizes this calibration to combine different classifiers effectively.

A mask R-CNN based automatic assessment system for nail psoriasis severity

Published in Computers in Biology and Medicine, 2022

1) Nail psoriasis negatively affects patients' quality of life and requires severity measures for effective treatment.
2) Dermatologists in Taiwan often manage high patient volumes, making complex assessments difficult.
3) A new system using deep learning architecture, mask R-CNN, simplifies and automates nail psoriasis severity assessment, potentially improving diagnosis and treatment decisions.

Correlated Drug Action as a Baseline Model for Combination Therapy in Patient Cohorts and Cell Cultures

Published in bioRxiv, 2023

1) CDA is a novel baseline model for studying drug combinations that considers potential correlations between drug efficacies.
2) The model can be applied in both temporal and dose domains to analyze different types of data, such as survival curves or dose-response curves.
3) The authors demonstrate the utility of tCDA at the clinical trial level and dCDA's applicability in experimental data assessment using a new metric, EOCDA.


