一、任务概述

本项大作业将设计并实现一个Mini Java语言的编译器

 

Mini Java概述

Mini Java是Java语言的子集。作为一种很好的编译课程教学语言,它与Java相比做了如下精简:

  1. 不允许重载(overloading)
  2. 一个文件中可以申明若干个类,但必须有且只有一个的主类,辅类可以有多个,类不能申明为public;主类中只能有一个主方法,该方法的签名必须为“public static void main(String[])”,其中String[]参数不做处理。主方法中只能有一条输出语句:System.out.println( int ),该语句只能输出整型变量值
  3. 只有类,没有接口,有继承关系(单继承)
  4. 类中只能申明变量和方法
  5. 只有四种变量类型:整型(integer)、布尔型(boolean)、数组(array)、对象;只有一类数组:整型数组(int[]);变量必须申明为(auto)型
  6. 方法必须为public,必须有返回值,返回值类型受(5)限制;可以有参数,可以没有,参数数量没有限制,类型受(5)限制
  7. 一共有6中语句(statement):代码块(block)、简单赋值语句(assignment statement)、数组赋值语句(array assignment statement)、打印语句(print statement)、if语句、while语句
  8. 一共有9种表达式(expression):与(and)、比较(compare)、加(plus)、减(minus)、乘(times)、数组定位(array lookup)、数组长度(array length)、消息传递(message sending,即参数传递)、主表达式(primary expression);与表达式为“短路与”(&&);比较只能作小于比较
  9. 主表达式一共有9种:整数(Integer)、“真”(true)、“假”(false)、对象、this、初始化(allocation)、数组初始化(array allocation)、非(not)、括号(bracket)
  10. 初始化时只能使用空参数,所以没有“构造器(constructor)”概念
  11. 对标识符(IDENTIFIER)没有作明确定义,在这里规定只能是字母、数字的集合,但必须以字母开头,区分大小写
  12. 对整数(INTEGER_LITERAL)没有作明确定义,在这里规定为无符号整数,32位(0~4294967295)
  13. 不允许注释
  14. 类变量声明时不能初始化,初始化必须在方法中完成
  15. 不能定义内部类

 

保留字、终结符

保留字 识别编码 记忆符
<EOF> 0 EOF -
boolean 1 BOOLEAN -
class 2 CLASS -
else 3 ELSE -
extends 4 EXTENDS -
fasle 5 FALSE -
if 6 IF -
int 7 INT -
length 8 LENGTH -
main 9 MAIN -
new 10 NEW -
public 11 PUBLIC -
return 12 RETURN -
static 13 STATIC -
this 14 THIS -
true 15 TRUE -
void 16 VOID -
while 17 WHILE -
String 18 STRING -
System.out.println 19 PRINTLN -
= 20 EQUAL -
! 21 NOT -
&& 22 AND -
+ 23 PLUS -
- 24 MINUS -
* 25 TIMES -
< 26 COMPARE -
. 27 DOT -
; 28 SEMICOLON -
, 29 COMMA -
[ 30 LEFT_SQUARE -
] 31 RIGHT_SQUARE -
( 32 LEFT_BRACKET -
) 33 RIGHT_BRACKET -
{ 34 LEFT_BLOCK -
} 35 RIGHT_BLOCK -
标识符 36 ID_STRING 内部字符串
无符号整数 37 ID_INTEGER 整数值

 

本编译器概述

  1. 语法分析程序用带回溯的递归子程序法
  2. 对源文件进行两遍处理:第一遍词法分析,第二遍语法分析
  3. 使用编译时静态分配存储空间
  4. 整型数据类型32位,占4个字节;布尔型数据类型8位,占1个字节;内存(由列表虚拟)寻址10位,1KB
  5. 为了实现方便,父类必须在子类之前定义
  6. 由于时间原因,编译器做了如下简化:
    1. 表达式只能处理加法、减法、乘法、小于比较、逻辑与,且只能对整数或布尔值直接进行计算,而不能计算变量的值
    2. 不能处理方法调用
    3. 不能处理数组
    4. 不能进行对象初始化
    5. 不能处理结构化语句