programing

문자열을 16진수 바이트로 인쇄

skycolor 2023. 6. 11. 10:32
반응형

문자열을 16진수 바이트로 인쇄

다음 문자열이 있습니다.Hello, World!그리고 파이썬을 '48:65:6c:6c:6c:6f:2c:20:57:6f:72:6c:64:21'로 사용하여 인쇄하고 싶습니다.

hex()정수에 대해서만 작동합니다.

어떻게 할 수 있습니까?

문자열을 정수 생성기로 변환할 수 있습니다.각 요소에 16진수 형식을 적용하고 구분 기호를 사용하여 삽입합니다.

>>> s = "Hello, World!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:2c:20:57:6f:72:6c:64:21
':'.join(x.encode('hex') for x in 'Hello, World!')

Python 2.x의 경우:

':'.join(x.encode('hex') for x in 'Hello, World!')

위의 코드는 Python 3.x에서 작동하지 않습니다. 3.x의 경우 아래 코드가 작동합니다.

':'.join(hex(ord(x))[2:] for x in 'Hello, World!')

일부는 읽기 쉽고 줄 바꿈 또는 문자열의 기타 홀수 문자를 디버깅하는 데 도움이 되는 두 줄로 된 다른 대답:

Python 2.7의 경우

for character in string:
    print character, character.encode('hex')

Python 3.7의 경우(일부 3 릴리스에서 테스트되지 않음)

for character in string:
    print(character, character.encode('utf-8').hex())

페도르 고골레프의 답변을 보완하는 몇 가지 사항:

첫째, 문자열에 ASCII 코드가 10 미만인 문자가 포함되어 있으면 필요에 따라 표시되지 않습니다.이 경우 올바른 형식은 다음과 같습니다.{:02x}:

>>> s = "Hello Unicode \u0005!!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:21:21'
                                           ^

>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:21:21'
                                           ^^

둘째, "문자열"이 실제로 "바이트 문자열"이라면 -- 그리고 차이가 파이썬 3에서 중요하기 때문에 -- 다음을 선호할 수 있습니다.

>>> s = b"Hello bytes \x05!!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:21:21'

바이트 개체는 "0 <= x < 256 범위의 불변 정수 시퀀스"로 정의되므로 위 코드에서 변환할 필요가 없습니다.

문자열을 16진수 바이트로 인쇄하시겠습니까?

승인된 답변은 다음과 같습니다.

s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)

반환:

'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'

허용된 답변은 바이트(대부분 ASCII 문자)를 사용하는 경우에만 작동합니다.그러나 유니코드를 사용하는 경우, 예를 들어:

a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.

어떻게든 바이트로 변환해야 합니다.

터미널에서 이러한 문자를 사용할 수 없는 경우 UTF-8에서 디코딩하거나 이름을 사용할 수 있습니다(코드를 붙여넣고 함께 실행할 수 있음).

a_string = (
    "\N{CYRILLIC CAPITAL LETTER PE}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER VE}"
    "\N{CYRILLIC SMALL LETTER IE}"
    "\N{CYRILLIC SMALL LETTER TE}"
    "\N{SPACE}"
    "\N{CYRILLIC SMALL LETTER EM}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{EXCLAMATION MARK}"
    "\N{EXCLAMATION MARK}"
)

다음과 같은 것을 확인할 수 있습니다.

":".join("{:02x}".format(ord(c)) for c in a_string)

돌아온다

'41f:440:438:432:435:442:20:43c:438:440:21:21'

빈약한/예상치 못한 결과 - 이것들은 우리가 유니코드에서 볼 수 있는 그래프를 만들기 위해 결합하는 코드 포인트입니다, 유니코드 컨소시엄에서 말이죠 - 전 세계의 언어를 나타냅니다.그러나 이것은 실제로 이 정보를 저장하는 방식이 아니므로 다른 출처에서 해석할 수 있습니다.

다른 소스에서 이 데이터를 사용할 수 있도록 하려면 일반적으로 UTF-8 인코딩으로 변환해야 합니다. 예를 들어, 이 문자열을 바이트 단위로 디스크에 저장하거나 html에 게시해야 합니다.그래서 우리는 코드 포인트를 UTF-8의 코드 단위로 변환하기 위해 인코딩이 필요합니다 - 파이썬 3에서,ord다음과 같은 이유로 필요하지 않습니다.bytes정수의 반복 가능성:

>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

또는 새로운 f-string(Python 3에서만 사용 가능)을 사용하여 보다 우아하게:

>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

에서 Python 2를 합니다.cord 째첫, 즉.ord(c)기타 예:

>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

의 를 사용할 수 있습니다.

import hexdump
hexdump.dump("Hello, World!", sep=":")

)로 표시됩니다..lower()대소문자를 구분해야 합니다.이것은 Python 2와 3 모두에서 작동합니다.

지도 및 람다 함수를 사용하면 16진수 값의 목록을 생성할 수 있으며, 이 값은 인쇄하거나 다른 용도로 사용할 수 있습니다.

>>> s = 'Hello 1 2 3 \x01\x02\x03 :)'

>>> map(lambda c: hex(ord(c)), s)
['0x48', '0x65', '0x6c', '0x6c', '0x6f', '0x20', '0x31', '0x20', '0x32', '0x20', '0x33', '0x20', '0x1', '0x2', '0x3', '0x20', '0x3a', '0x29']

Python 3이나 콜론에 관심이 없는 사람들에게 조금 더 일반적입니다.

from codecs import encode

data = open('/dev/urandom', 'rb').read(20)
print(encode(data, 'hex'))      # Data

print(encode(b"hello", 'hex'))  # String

이 작업은 다음과 같은 방법으로 수행할 수 있습니다.

from __future__ import print_function
str = "Hello, World!"
for char in str:
    mm = int(char.encode('hex'), 16)
    print(hex(mm), sep=':', end=' ')

이 출력은 다음과 같이 16진수로 표시됩니다.

0x480x650x6c 0x6c 0x6f 0x200x570x6f 0x720x6c 0x640x21

보다 뛰어난 성능을 제공하는 제품의 경우''.format()다음을 사용할 수 있습니다.

>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in 'Hello, World!' )
'48:65:6C:6C:6F:2C:20:57:6F:72:6C:64:21'
>>> 
>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in b'Hello, World!' )
'48:65:6C:6C:6F:2C:20:57:6F:72:6C:64:21'
>>> 

이것이 더 좋게 보일 수 없어서 죄송합니다.

간단하게 할 수 있다면 좋을 것 같습니다.'%02x'%v하지만 그것은 단지...

하지만 당신은 바이트 문자열에 갇히게 될 것입니다.b''을 선택할 ord(v).

f-문자열 포함:

"".join(f"{ord(c):x}" for c in "Hello")

구분 기호 사용:

>>> "⚡".join(f"{ord(c):x}" for c in "Hello")
'48⚡65⚡6c⚡6c⚡6f'

그냥 편의상, 아주 간단합니다.

def hexlify_byteString(byteString, delim="%"):
    ''' Very simple way to hexlify a byte string using delimiters '''
    retval = ""
    for intval in byteString:
        retval += ('0123456789ABCDEF'[int(intval / 16)])
        retval += ('0123456789ABCDEF'[int(intval % 16)])
        retval += delim
    return(retval[:-1])

hexlify_byteString(b'Hello, World!', ":")
# Out[439]: '48:65:6C:6C:6F:2C:20:57:6F:72:6C:64:21'

언급URL : https://stackoverflow.com/questions/12214801/print-a-string-as-hexadecimal-bytes

반응형