본문 바로가기
TIL/CS

HTTP

by J1-H00N 2023. 10. 19.

HTTP는 애플리케이션 계층으로 웹 서비스 통신에 사용된다.

  • HTTP/1.0
    • 기본적으로 한 연결당 하나의 요청을 처리하도록 설계되었다.
    • 이로 인해 서버로부터 파일을 가져올 때마다 TCP의 3-way handshake를 계속해서 열어야 하기 때문에 RTT가 증가하는 단점이 있다.
    • RTT - 패킷이 목적지에 도달하고 나서 다시 출발지로 돌아오기까지 걸리는 시간이며 패킷 왕복 시간
    • 이로인해 서버에 부담이 많이 가고 사용자 응답 시간이 길어졌다. 이를 해결하기 위해 이미지 스플리팅, 코드 압축, 이미지 Base64 인코딩을 사용하곤 했다.
      • 이미지 스플리팅 - 많은 이미지를 다운받게 되면 과부하가 걸리기 때문에 많은 이미지가 합쳐 있는 하나의 이미지를 다운받고, 이를 기반으로 background-image 의 position을 이용하여 이미지를 표기하는 기법이다.
      • 코드 압축 - 코드를 압축해서 개행 문자, 빈칸을 없애서 코드의 크기를 최소화하는 방법이다.
      • 이미지 Base64 인코딩 - 이미지 파일을 64진법으로 이루어진 문자열로 인코딩하는 방법이다. 이 방법을 사용하면 서버와의 연결을 열고 이미지에 대해 서버에 HTTP 요청을 할 필요가 없다는 장점이 있다. 하지만 37% 정도 크기가 더 커지는 단점이 있다.
  • HTTP/1.1
    • 매번 TCP 연결을 하는 것이 아니라 한 번 TCP 초기화를 한 이후에 keep-alive라는 옵션으로 여러 개의 파일을 송수신할 수 있게 바뀌었다.
    • HTTP/1.0에서도 keep-alive가 있었으나 HTTP/1.1부터 표준화 되어 기본 옵션으로 설정되었다.
    • 문서 안에 포함된 다수의 리소스를 처리하려면 요청할 리소스  개수에 비례해서 대기 시간이 길어지는 단점이 있다.
    • HOL Bloking - 네트워크에서 같은 큐에 있는 패킷이 그 첫 번째 패킷에 의해 지연될 때 발생하는 성능 저하 현상을 말한다.
    • HTTP/1.1 헤더에는 쿠키 등 많은 메타데이터가 들어 있고 압축이 되지 않아 무거웠다.
  • HTTP/2
    • SPDY 프로토콜에서 파생된 HTTP/1.X보다 지연 시간을 줄이고 응답 시간을 더 빠르게 할 수 있으며 멀티플렉싱, 헤더 압축, 서버 푸시, 요청의 우선순위 처리를 지원하는 프로토콜이다.
      • 멀티 플렉싱 - 여러 개의 스트림을 사용하여 송수신하는 것이다. 특정 스트림의 패킷이 손실되었다고 해도 해당 스트림에만 영향을 미치고 나머지 스트림은 멀쩡하게 동작할 수 있다. 이를 통해 HTTP/1.X에서 발생하는 HOL Blocking 문제를 해결할 수 있다.
      • 헤더 압축 - 허프만 코딩 압축 알고리즘을 사용하는 HPACK 압축 형식을 통해 헤더를 압축한다.
      • 허프만 코딩 - 문자열을 문자 단위로 쪼개 빈도수를 세어 빈도가 높은 정보는 적은 비트 수를 사용하여 표현하고, 빈도가 낮은 정보는 비트 수를 많이 사용하여 표현하여 전체 데이터의 표현에 필요한 비트양을 줄이는 원리이다.
      • 서버 푸시 - 클라이언트 요청 없이 서버가 바로 리소스를 푸시할 수 있다. html을 읽으면서 그 안에 들어 있던 css 파일을 서버에서 푸시하여 클라이언트에 먼저 줄 수 있다.
  • HTTPS
    • HTTP/2는 HTTPS 위에서 동작한다. HTTPS는 애플리케이션 계층과 전송 계층 사이에 신뢰 계층인 SSL/TLS 계층을 넣은 신뢰할 수 있는 HTTP 요청을 말한다. 이를 통해 통신을 암호화 한다.
      • SSL/TLS
        • SSL은 SSL1.0부터 시작하여 SSL2.0, SSL3.0, TLS1.0, TLS1.3까지 버전이 올라가며 마지막으로 TLS로 명칭이 변경되었으나, 보통 이를 합쳐 SSL/TLS로 많이 부른다.
        • 전송 계층에서 보안을 제공하는 프로토콜이다. 클라이언트와 서버가 통신할 때 SSL/TLS를 통해 인터셉터를 방지해 제3자가 메시지를 도청하거나 변조하지 못하도록 한다.
        • 보안 세션을 기반으로 데이를 암호화하며 보안 세션이 만들어질 때 인증 메커니즘, 키 교환 암호화 알고리즘, 해싱 알고리즘이 사용된다.
        • 보안 세션 - 보안이 시작되고 끝나는 동안 유지되는 세션을 말한다. SSL/TLS는 핸드셰이크를 통해 보안 세션을 생성하고 이를 기반으로 상태 정보 등을 공유한다.
        • TLS의 핸드셰이크는 클라이언트와 서버가 키를 공유하고 이를 기반으로 인증, 인증 확인 등의 작업이 일어나는 단 한 번의 1-RTT가 생긴 후 데이터를 송수신한다. 클라이언트가 사이퍼 슈트를 서버에 전달하면 서버는 받은 사이퍼 슈트의 암호화 알고리즘 리스트를 제공할 수 있는지 확인한다. 제공할 수 있다면 서버에서 클라이언트로 인증서를 보내는 인증 메커니즘이 시작되고 이후 해싱 알고리즘 등으로 암호화된 데이터의 송수신이 시작된다.
          • 사이퍼 슈트 - 프로토콜, AEAD 사이퍼 모드, 해싱 알로리즘이 나열된 규약을 말하며, 다섯 개가 있다. 
            TLS_AES_128_GCM_SHA256
            TLS_AES_256_GCM_SHA384
            TLS_CHACHA20_POLY1305_SHA256
            TLS_AES_128_CCM_SHA256
            TLS_AES_128_CCM_8_SHA256
            예를 들어 TLS_AES_128_GCM_SHA256에는 세 가지 규약이 들어있는데 TLS는 프로토콜, AES_128_GCM은 AEAD 사이퍼 모드, SHA256은 해싱 알고리즘을 뜻한다.
          • AEAD 사이퍼 모드 - AEAD는 데이터 암호화 알고리즘이며 AES_128_GCM 등이 있다. 예를 들어 AES_128_GCM은 128비트의 키를 사용하는 표준 블록 암호화 기술과 병렬 계산에 용이한 암호화 알고리즘 GCM이 결합된 알고리즘을 뜻한다.
          • 인증 메커니즘 - CA에서 발급한 인증서를 기반으로 이루어진다.이 인증서는 안전한 연결을 시작하는데 있어 필요한 공개키를 클라이언트에 제공하고 사용자가 접속한 서버가 신뢰할 수 있는 서버임을 보장한다. 인증서는 서비스 정보, 공개키, 지문, 디지털 서명 등으로 이루어져 있다. CA는 엄선된 기업만이 가능하며 대표적으로 Comodo, GoDaddy, GlobalSign, 아마존 등이 있다.
          • CA 발급 과정 - 자신의 사이트 정보와 공개키를 CA에 제출 > CA는 공개키를 해시한 값인 지문을 사용하는 CA의 비밀키 등을 기반으로 CA 인증서를 발급
          • 암호화 알고리즘 - 대수곡선 기반의 ECDHE 또는 모듈식 기반의 DHE를 사용한다. 둘 다 디피-헬만 방식을 근간으로 만들어졌다.
          • 디피-헬만 키 교환 암호화 알고리즘 - 암호키를 교환하는 하나의 방법이다. y= g^x mod p 식에서 g와 x와 p를 안다면 y는 구하기 쉽지만 g와 y와 p만 안다면 x를 구하기 어렵다는 원리에 기반한 알고리즘이다. 처음에 공개값을 공유하고 각자의 비밀 값과 혼합한 후 혼합 값을 공유한다. 그다음 각자의 비밀 값과 또 혼합한다. 그 이후에 공통의 암호키가 생되는 것이다. 이렇게 클라이언트와 서버 모두 개인키와 공개키를 생성하고 서로에게 공개키를 보내고 공개키와 개인키를 결합하여 PSK(사전 합의된 비밀키)가 생성되면 악의적인 공격자가 개인키 또는 공개키를 가지고도 PSK가 없기 때문에 아무것도 할 수 없다.
          • 해싱 알고리즘 - 데이터를 추정하기 힘든 더 작고, 섞여 있는 조각으로 만드는 알고리즘이다. SSL/TLS는 SHA-256, SHA-384를 쓰며, 그 중 SHA-256을 많이 쓴다.
          • SHA-256 - 해시 함수의 결과값이 256비트인 알고리즘이며 비트 코인을 비롯한 많은 블록체인 시스템에서도 쓴다. SHA-256 알고리즘은 해싱을 해야 할 메시지에 1을 추가하는 등 전처리를 하고 전처리된 메시지를 기반으로 해시를 반환한다.
          • 해시 - 다양한 길이를 가진 데이터를 고정된 길이를 가진 데이터로 매핑한 값
          • 해싱 - 임의의 데이터를 해시로 바꿔주는 일이며 해시 함수가 이를 담당한다.
          • 해시 함수 - 임의의 데이터를 입력으로 받아 일정한 길이의 데이터로 바꿔주는 함수
    • HTTPS를 구축하는 방법 크게 세 가지다. 직접 CA에서 구매한 인증키를 기반으로 HTTPS 서비스를 구축하거나, 서버 앞단의 HTTPS를 제공하는 로드밸런서를 두거나, 서버 앞단에 HTTPS를 제공하는 CDN을 둬서 구축한다.
  • HTTP/3
    • TCP위에서 돌아가는 HTTP/2와 달리 QUIC라는 계층 위에서 돌아가며, TCP 기반이 아닌 UDP 기반으로 돌아간다.
    • HTTP/2의 장점인 멀티플렉싱을 가지고 있으며 TCP를 사용하지 않기 때문에 번거로운 3-way handshake 과정을 거치지 않아초기 연결 설정 시 지연 시간 감소라는 장점이 있다.
    • QUIC는 첫 연결 설정에 1-RTT만 소요된다. 클라이언트가 서버에 어떤 신호를 한 번 주고, 서버도 거기에 응답하기만 하면 바로 본 통신을 시작할 수 있다는 것이다.
    • QUIC는 순방향 오류 수정 메커니즘이 적용되어 있어 전송한 패킷이 손실되었다면 수신 측에서 에러를 검출하고 수정하는 방식이며 열악한 네트워크 환경에서도 낮은 패킷 손실률을 자랑한다.

'TIL > CS' 카테고리의 다른 글

메모리  (0) 2023.10.20
운영체제  (0) 2023.10.19
네트워크 기기/ IP  (0) 2023.10.18
TCP/IP 4계층 모델  (0) 2023.10.17
네트워크  (0) 2023.10.13