疯狂java


您现在的位置: 疯狂软件 >> 新闻资讯 >> 正文

Java Class文件结构实例分析(上)


 

本文假定读者对Java Class文件格式有一些基本的了解,建议结合相关书籍进行对照阅读。
 
Class文件格式信息
 
实例代码
package chapter6;
public class TestClass {
    private int m;
    public int inc() {
        return m + 1;
    }
}
使用JDK1.8编译成class文件,然后通过WinHex打开
 
魔数(magic)
类型:u4 
字节地址:00000000~00000003 
值:0xCAFEBABE
 
Class文件版本
次版本号(minor_version)
类型:u2 
字节地址:00000004~00000005 
值:0x0000
 
主版本号(major_version)
类型:u2 
字节地址:00000006~00000007 
值:0x0034
 
将0x0034转换为十进制,计算得到52,对应版本号为JDK 1.8。
 
常量池
常量池容量计数值(constant_pool_count)
类型:u2 
字节地址:00000008~00000009 
值:0x0016
 
将0x0016转换为十进制,计算得到22。由于容量计数是从1开始(如果没有特殊情况,通常都是从0开始),因此常量池中有21项常量,索引值范围为1~21。
 
 
常量池中每一项常量都是一个表,表开始的第一位是一个u1类型的标志位(tag)。
 
第1项常量
tag类型:u1 
tag字节地址:0000000A 
tag值:0x07
 
查表可知这个常量属于CONSTANT_Class_info结构,代表一个类或者接口的符号引用。
 
name_index类型:u2 
name_index字节地址:0000000B~0000000C 
name_index值:0x0002
 
0x0002指向了常量池中的第2项常量。
 
第2项常量
tag类型:u1 
tag字节地址:0000000D 
tag值:0x01
 
查表可知这个常量属于CONSTANT_Utf8_info结构,代表一个UTF-8编码的字符串。
 
length类型:u2 
length字节地址:0000000E~0000000F 
length值:0x0012
 
将0x0012转换为十进制,计算得到18。
 
bytes类型:u1 
bytes字节地址:00000010~00000021(length表明地址范围为18个字节) 
bytes值:下方图片浅蓝底对应的所有字节内容
 
通过WinHex查看,对应内容为chapter6/TestClass,即类的全限定名。
 
通过逐个字节对照ASCII字符表,我们同样可以得到内容为chapter6/TestClass。
 
获取ASCII字符表:在Linux上执行man ascii,翻页在Tables项可以看到字符表。
查找字符:先找横坐标,再找纵坐标,横竖交叉的位置即为字节对应的字符。
例如0x63为c,0x68为h,0x61为a,0x70为p,0x74为t,0x65为e,0x72为r,连起来代表单词chapter
 
第3项常量
tag类型:u1 
tag字节地址:00000022 
tag值:0x07
 
这个常量属于CONSTANT_Class_info结构,代表一个类或者接口的符号引用。
 
name_index类型:u2 
name_index字节地址:00000023~00000024 
name_index值:0x0004
 
0x0004指向了常量池中的第4项常量。
 
第4项常量
tag类型:u1 
tag字节地址:00000025 
tag值:0x01
 
这个常量属于CONSTANT_Utf8_info结构,代表一个UTF-8编码的字符串。
 
length类型:u2 
length字节地址:00000026~00000027 
length值:0x0010
 
将0x0010转换为十进制,计算得到16。
 
bytes类型:u1 
bytes字节地址:00000028~00000037(length表明地址范围为16个字节) 
bytes值:下方图片浅蓝底对应的所有字节内容
 
通过WinHex查看,对应内容为java/lang/Object,即类的全限定名。
 
第5项常量
tag类型:u1 
tag字节地址:00000038 
tag值:0x01
 
这个常量属于CONSTANT_Utf8_info结构,代表一个UTF-8编码的字符串。
 
length类型:u2 
length字节地址:00000039~0000003A 
length值:0x0001
 
bytes类型:u1 
bytes字节地址:0000003B(length表明地址范围为1个字节) 
bytes值:0x6D
 
通过WinHex查看,对应内容为实例变量m。
 
其他常量可以通过类似的方法进行分析,但这样一个个分析确实挺辛苦的。
 
其实,JDK已经为我们提供了一个Class文件字节码工具:javap,可以让我们较为直观的看到Class文件的字节码内容。
 
执行命令:javap -verbose TestClass.class,截取常量池部分内容如下:
 
可以看到,版本号及前5个常量与我们分析的结果是一致的。所以,能用1行代码搞定的事儿,就不要用2行(浪费笔墨)。
 
常量池最后一个字节:000000D8
 
访问标志(access_flags)
类型:u2 
字节地址:000000D9~000000DA 
值:0x0021
 
查看类或接口访问标志含义表可知,该类的访问标志为ACC_PUBLIC(0x0001)、ACC_SUPER(0x0020)。
 
另外,通过类的定义public class TestClass,同样可以推断出类的访问标志为ACC_PUBLIC、ACC_SUPER,而ACC_INTERFACE、ACC_ENUM、ACC_FINAL、ACC_ABSTRACT、ACC_ANNOTATION、ACC_SYNTHETIC都可以排除。
 
所以,access_flags应该为0x0001|0x0020=0x0021,结果与查看字节码相同。
 
类索引(this_class)
类型:u2 
字节地址:000000DB~000000DC 
值:0x0001
 
this_class指向常量池的第1个常量,基于前面的分析可知:
 
第1个常量的类型为Class,Class名称索引指向第2个常量。
第2个常量类型为Utf8,对应内容为chapter6/TestClass。
因此,类索引(this_class)指向的类为chapter6/TestClass。
 
父类索引(super_class)
类型:u2 
字节地址:000000DD~000000DE 
值:0x0003
 
同样,super_class指向常量池的第3个常量。
 
第3个常量的类型为Class,Class名称索引指向第4个常量。
第4个常量类型为Utf8,对应内容为java/lang/Object。
因此,父类索引(super_class)指向的类为java/lang/Object。
 
接口计数器(interfaces_count)
类型:u2 
字节地址:000000DF~000000E0 
值:0x0000
 
接口计数器值为0,说明该类没有实现任何接口。
 
接口表(interfaces)
 
类索引(this_class)、父类索引(super_class)和接口索引(interfaces)这三项数据共同确定了当前类以及其继承关系,相关常量池内容如下:
 
完整地址范围:000000DB~000000E0
 
字段
字段计数器(fields_count)
类型:u2 
字节地址:000000E1~000000E2 
值:0x0001
 
说明当前类有1个字段。
 
字段表(fields)
 
访问标志(access_flags)
 
类型:u2 
字节地址:000000E3~000000E4 
值:0x0002
 
对应的访问标志为ACC_PRIVATE。
 
名称索引(name_index)
 
类型:u2 
字节地址:000000E5~000000E6 
值:0x0005
 
对应常量池中的第5项常量,即字段名为m。
 
描述符(descriptor_index)
 
类型:u2 
字节地址:000000E7~000000E8 
值:0x0006
 
对应常量池中的第6项常量,值为I,即int类型。
 
因此,该字段的定义为private int m;
 
属性计数器(attributes_count)
类型:u2 
字节地址:000000E9~000000EA 
值:0x0000
 
说明该字段没有属性信息。
 
属性表(attributes)
无。
 
字段完整地址范围:000000E1~000000EA
 
最后是方法和属性,由于内容复杂度及篇幅原因,我们下篇再续。