python进阶100集(9)int数据类型深入分析
一、基本概念
int数据类型基本上来说这里指的都是整形,下一届我们会讲解整形和浮点型的转化,以及精度问题!
a = 100
b = a
这里a是变量名,100就是int数据对象,b指向的是a指向的对象,所以b指向的也是100。
二、核心特性分析
不可变性
int类型为不可变对象,修改值会创建新对象而非原地修改:
a = 10
print(id(a)) # 输出内存地址1
a += 1
print(id(a)) # 输出新内存地址(地址改变)
非可迭代性
int未实现__iter__()方法,直接迭代会触发TypeError:
for i in 123: # 报错:'int' object is not iterable
print(i)
切片限制
整数不支持切片操作,需先转换为字符串处理:
num = 123456
# 错误写法:num[1:3]
# 正确转换:
print(str(num)[1:3]) # 输出"23"
三、底层结构解析
1. C语言实现结构
的int在C中通过P y Long Object实现,核心字段包括:
ob_digit:动态数组存储绝对值(按需分配内存)
ob_size:记录数字位数和符号(负数为负值)
2. 内存管理机制
小整数池:[-5, 256]范围内的整数会被缓存复用
a = 10
b = 10
print(a is b) # True(小整数池优化)
大整数分配:超出缓存范围的整数每次创建新对象
x = 1000
y = 1000
print(x is y) # False(非小整数池)
3. 堆栈存储模型
变量引用:栈内存存储指向堆内存对象的指针
对象实体:堆内存存储PyLongObject结构体及数据
import sys
n = 2**1000
print(sys.getsizeof(n)) # 输出对象内存占用(如48字节)
四、典型场景示例
1. 进制转换与运算
hex_num = 0xFF # 十六进制
bin_num = 0b1010 # 二进制
print(hex_num + bin_num) # 输出265(自动转为十进制运算):ml-citation{ref="7" data="citationList"}
2. 类型转换实现伪切片
def int_slice(num, start, end):
return int(str(num)[start:end])
print(int_slice(31415926, 2, 5)) # 输出415:ml-citation{ref="3" data="citationList"}
3. 内存地址验证
x = 999
y = 999
print(id(x), id(y)) # 不同地址(大整数无缓存):ml-citation{ref="8" data="citationList"}
4. 内存结构分解
栈内存(Stack)
存储变量名a的引用指针(64位系统占8字节)
指针指向堆内存中的整数对象地址
堆内存(Heap)
存储PyLongObject结构体(Python的整数对象)
struct {
PyObject_HEAD // 对象头(类型指针/引用计数)
long ob_digit[1]; // 实际存储数值的数组
}
对于小整数(-5到256),Python会复用小整数池中的对象
5. 具体内存布局示例
情况1:小整数(-5 ≤ value ≤ 256)
a = 100 # 触发小整数池优化
栈内存:a → 0x7f8e3c0024a0(指向预分配地址)
堆内存:
对象头:类型标记为int,引用计数=∞(池化对象不计引用)
数值存储:ob_digit[0] = 100
情况2:大整数(超出缓存范围)
a = 1000 # 新建对象
栈内存:a → 0x55a1b2d67ef0(动态分配地址)
堆内存:
对象头:引用计数=1
数值存储:ob_digit[0] = 1000(可能占用更多内存)