Tony Kwon

https://twkwon0417.github.io/Tony KwonInfra, Server, Coding 배운것들 정리하기 2026-04-13T20:20:37+09:00 Tony Kwon https://twkwon0417.github.io/ Jekyll © 2026 Tony Kwon /assets/img/favicons/favicon.ico /assets/img/favicons/favicon-96x96.png Distributed System 12026-04-06T06:33:14+09:00 2026-04-06T06:33:14+09:00 https://twkwon0417.github.io/posts/DS_1/ Tony Kwon

Distributed Systems Definition Collection of independent computers that appears to users as a single coherent system(Transparency) Characteristics Making resources accessible Distribution Transparency Openness Scalability 1. Making Resources accessible 유저가 remote resources에 쉽게 접근할수 있게 Controlled and efficient way로 공유할수 있게 요즘 많은 accessibility를 요구한다. eg. groupware, CSCW: co...

In-place FFT2026-03-10T19:31:34+09:00 2026-03-10T13:59:50+09:00 https://twkwon0417.github.io/posts/inplace_FFT/ Tony Kwon

Bit-reversal 재귀 트리를 따라 내려가면서 배열이 어떻게 찢어지는지 보면, 특이한 패턴을 발견할수 있다. N = 8인 배열이 재귀 함수를 타고 내려가는 과정을 보자 매 step마다 2로 나뉘어지고, 숫자표현이 이진수로 되어있으니 각 step 별로 짝홀 판단은 LSB로 시작해서 MSB에 결정됨을 쉽게 이해할수 있다. 따라서 우선 배열들을 인접한 애들끼리 정렬한다음, 아래서 순서대로 연산을 진행한다 추가적인 메모리 할당 없이 원보 배열 하나에서 자리만 바꿔가며 연산하는 반복문 기반의 In-Place FFT를 사용할수 있다. void bitReverse(vector<complex<double> >& x) { size_t N = x.size(); ...

FT에서 FFT로 (2)2026-03-10T00:11:11+09:00 2026-03-10T00:11:11+09:00 https://twkwon0417.github.io/posts/FFT_2/ Tony Kwon

Butterfly 연산 다항식을 짝수항, 홀수항으로 분할 할수 있다는 것은 이해가 되는데 후에 병합될때가 잘 이해가 안된다. [P(x)=P_{even}(x^2)+xP_{odd}(x^2)] N개의 복소수 거듭제곱근을 각각 대입했을 때 나오는 point value들을 가지고 butterfly 연산을 수행하면 더 촘촘한 결과를 뽑을수 있다는 것인데 이는 [P_{even} + w^kP_{odd}] 에서 \(w^k\)에 의해 구현된다. 여기서 \(w^k\)는 회전 인자로써, 기존값을 특정 각도만큼 회전 시켜서 원래는 없던 빈공간을 찔러보는 새로운 값으로 변형된다. 코드 참고로 코드들은 최적화를 진행하지 않은 생짜 FFT 코드이다. 기본에 충실한 DFT 코드 [X[k] = \sum_{n=0}...

FT에서 FFT로 (1)2026-03-03T04:51:59+09:00 2026-03-31T19:44:06+09:00 https://twkwon0417.github.io/posts/FFT/ Tony Kwon

Sound를 Frequency로 분해, 신호를 다항식으로 보고 그 다항식을 단위근에서 평가 한게 신호 x[n]을 계수로 가지는 다항식 뿐만 아니라, 불확정성원리, 리만 제타 함수와 소수, 미분 방정식등 여러 분야에서 활용됨 다항식 관점에서의 DFT (Convolution) Coefficient representation -> Point value representation 로 변환해줘 신호를 다항식으로 보고 그 다항식을 단위근에서 평가한것 Coefficient representation 우리가 흔히 아는 다항식 표현법 다항식 덧셈 뺄셈은 빠르지만 곱연산의 경우 느림 Pointwise representation n개의 서로 다른 xi 갑소가 그에 대응하...

CUDA Optimizing Matrix Addition2026-02-24T07:52:00+09:00 2026-02-24T07:52:00+09:00 https://twkwon0417.github.io/posts/CUDA-Overlap/ Tony Kwon

Matrix addition을 stream을 사용해서 최적화 시키고 분석해보면서 배운것 기존 synchronous하게 matrix addition에서 DMA Controller 작업과 SM작업을 overlapping하서 최적화를 진행 하였다. 기존 default stream으로 synchronous하게 진행되는것에서 4개의 stream에 asyncMemcp를 이용해서 비동기적으로 작동하게 하였다. Stream수 만큼 data를 나눠서, 각 스트림마다 같은 커널 연산을 나눠진 데이터로 수행하게 for(int i = 0; i < size(streams); i++) { long long offset = i * perStream; cudaMemcpyAsync(...