Next Previous Contents

3. 常见问题

这里是一些有关使用Linux进行以太网连接的常见问题。某些特定问题按照制造商进行 分类。可能你想问的问题别人已经问过(而且被回答了!),所以即使没有在这里找到你 的答案,还可能在诸如Dejanews之类的新闻档案中找到你所要的。

3.1 Alpha驱动程序——获取与使用

我听说我的网卡有一个更新的或初步的/alpha驱动程序。从哪儿得到它呢?

最新的“新”驱动程序可以在Donald的FTP站 点:cesdis.gsfc.nasa.gov里面的/pub/linux/下找到。因为 事情变化很频繁,可能需要四处找一找。或者使用WWW浏览器去:

Don的Linux主页

查找你想要的驱动程序更简单一些。(留神WWW浏览器会悄悄地把源码中的TABs替换为 空格,等等 - 如果无法确定的话,使用FTP下载,至少也得用WWW浏览器的FTP URL。)

如果驱动程序确实是alpha版本,或pre-alpha版本,那么请恰当地对待它。换句话说, 不要抱怨,因为你无法弄清用它能做些什么。同样,如果它使你的机器宕机了,不要抱怨。 相反,你应该发给我们一份材料组织很好的Bug报告,如果是一个布丁,那就更好!

注意,某些“可用”的实验性/alpha驱动程序已经包含在标准的内核源码树中。在运 行make config时你首先要回答的一个问题就是“Prompt for development and/or incomplete code/drivers”。在此你要回答“Y”以包括任何alpha/实验性驱动程序。

3.2 一台机器使用多个以太网卡

做些什么才能让Linux运行两块以太网卡?

这个问题的答案取决于驱动程序是否被用做可载入的模块或者直接编译进了内核。大多 数Linux发行版本现在都使用模块化的驱动程序。这样就不用发行许多内核,每种内核设置 一个不同的内建驱动程序。使用一个单一的基本内核,如果特定用户系统需要,一旦系统 启动,就足以从驱动程序模块文件(通常存储在/lib/modules/)中载入个 别的驱动程序。

把驱动程序作为模块使用:对于PCI驱动程序,模块通常会自动检测该品牌类 型所有安装的网卡。但对于ISA网卡,探寻一个网卡是不安全的操作,因此你需要提供网卡 的I/O地址以便模块知道去哪里查找。这一信息存储在文件/etc/conf.modules中。

例如,如果一个用户有两块ISA NE2000网卡,一块在0x300, 一块在0x240,它们在/etc/conf.modules文件中显示如下:

        alias eth0 ne
        alias eth1 ne
        options ne io=0x240,0x300

这几行的意义:就是说如果管理员(或内核)进行modprobe eth0或 者modprobe eth1,那么为eth0或 者eth1载入ne.o驱动程序。此外,在载 入ne.o模块时,使用选项io=0x240,0x300,这样驱动程序就 知道去哪里寻找网卡。注意0x很重要 - DOS里常用的300h在 这里没有用。改变0x2400x300的顺序会使哪一块物理网卡 以eth0eth1结尾发生改变。

同这个例子一样,大多数ISA模块驱动程序可以接受多个以逗号分隔的I/O值以处理多块 网卡。但是,某些(老的?)驱动程序,比如3c501.o模块,目前载入一个模块只能处理一 块网卡。这样,要检测两块网卡就必须载入两次该模块。此时,文 件/etc/conf.modules将如下所示:

        alias eth0 3c501
        alias eth1 3c501
        options eth0 -o 3c501-0 io=0x280 irq=5
        options eth1 -o 3c501-1 io=0x300 irq=7

在此例中,选项-o用来给每个模块实例一个唯一的名字,因为不能用同 一个名字载入两个模块。选项irq=也是用来指定网卡设置的硬件IRQ。(此 方法也能用于可接受多个以逗号分隔的I/O值的模块,但这样会使模块被不必要地载入两次, 降低了效率。)

最后一个例子,假设用户有一块在0x350的3c503网卡和一块 在0x280的SMC Elite16 (wd8013)网卡。则应该这样:

        alias eth0 wd
        alias eth1 3c503
        options wd io=0x280
        options 3c503 io=0x350

对于PCI网卡,只要用alias语句把ethN接口和相应的驱动 程序名联系起来就行了,因为PCI网卡的I/O地址可以被安全地检测到。

可用的模块一般存放在/lib/modules/`uname -r`/net下,这 里uname -r命令可以得到内核的版本(比如2.0.34)。你可以在这里看看哪 一个驱动程序适合你的网卡。一旦你在conf.modules文件里进行了正确的设 置,就可以用下面的方法检查一下:

        modprobe ethN
        dmesg | tail

这里“N”是你要检测的以太网卡的接口号。

使用编译进内核的驱动程序:如果你需要的驱动程序编译进了内核,那么处 理多块以太网卡的接口已经存在了。但缺省情况下只自动检测一块以太网卡。这 样就避免了启动时检测敏感网卡可能引起的麻烦。

(注意:在2.1.x之后的内核中,启动检测被分为安全和不安全的两类,所有安全的检 测(如对PCI和EISA网卡)可以自动找到所有相关的网卡。在至少有一块ISA网卡的多网卡 系统中还需要进行以下的处理。)

有两种方法可以启动对第二块(或第三块等等)网卡的自动检测。最简单的方法是向内 核传递启动参数,由LILO完成。使用ether=0,0,eth1这样简单的启动参数就 可以完成对第二块网卡的检测。此时按照启动时找到的网卡顺序分 配eth0eth1。假如你想让0x300处的网卡 为eth0,而0x280处的网卡为eth1,那么可以 使用

LILO: linux ether=5,0x300,eth0 ether=15,0x280,eth1

命令ether=可以接受的参数并不仅限于如上所示的IRQ + I/O + name。 请参看传递以太网参数......以了解全部的句法、 网卡特定参数和LILO使用技巧。

这些启动参数可以固定,这样就不用每次都必须重新敲一遍。参看LILO手册中有关LILO 的配置选项“append”。

第二种方法(不建议使用)是编辑文件Space.c并用零替换I/O地址中 的0xffe0入口。0xffe0入口是用来告诉内核不要检测该设 备 -- 把它替换为零就启动了对该设备的自动检测。

注意,如果想用Linux作为两个网络间的路由,你需要启动IP转发并重新编译内核。一 般在一台老式的AT/286上运行“kbridge”一类的软件就相当不错了。

如果你是一边在网络冲浪,一边看本文档,最好去阅读Donald的WWW站点上 的mini-howto。看一下多块以太网卡.

3.3 这个以太东东不干活。为什么?

如上所述,命令ether=对编译进了内核的驱动程序起作用。 现在大多数的发行版本都用模块的方式使用驱动程序,所以很少再使用ether=命 令了。(某些早期文档需要更新以反映这一变化。)如果你想使用模块化的以太网驱动程 序的选项,必须修改/etc/conf.modules文件。

如果你使用编译的驱动程序,而且已经把ether=加进了LILO 配置文件,需要重新运行lilo使更新后的配置文件生效。

3.4 NE1000 / NE2000网卡(及其兼容卡)的问题

问题:在用v2.0.x启动时没有检测到PCI NE2000兼容网卡。

原因:在v2.0.30之前的ne.c驱动程序只知道基于RealTek 8029的 兼容网卡的PCI ID号。在此只后才出现了使用其它PCI ID号的PCI NE2000兼容网卡,所以 驱动程序无法检测这些网卡。

解决方案:最简单的方法是把Linux内核升级到v2.0.31以上版本。它可以识别五 种不同的NE2000-PCI芯片的ID号,在启动或载入模块时自动检测到它们。如果你升级到 了2.0.34以上版本,会有一个比原先的ISA/PCI驱动程序稍小但更高效的PCI专用NE2000驱 动程序。

问题:启动时PCI NE2000兼容网卡被报告为ne1000(8比特网卡!)或者在v2.0.x下 载入ne.o模块不起作用。

原因:某些PCI兼容网卡不支持字节存取(因此不是百分之百的兼容NE2000)。 这使检测时被误认为NE1000网卡。

解决方案:你需要升级到v2.0.31以上版本。现在的驱动程序会检测到这种硬件Bug。

问题:PCI NE2000网卡的性能很差,即使按照性能技巧章节所说的减小了窗口 大小。

原因:十多年前设计和出售的初始8390芯片的技术数据手册上提到,为了得到 最高的可靠性,在每次写操作之前需要一个读操作。驱动程序能够轻易地做到这一点,但 从v1.2内核时代起,缺省情况下取消了这一操作。有一个用户报告说重新使用这一“错误 的特性”就可以改善廉价的PCI NE2000兼容网卡的性能。

解决方案:由于只有一个用户提出报告把它作为解决方案,不要对此寄予太大 的希望。重新使用写之前的读操作可以简单地编辑linux/drivers/net/下的 驱动程序文件,取消包含NE_RW_BUGFIX的那一行的注释,然后重建内核或载 入相应的模块。如果这样确实有效,请给我发一封e-mail,描述性能上的差异和你所使用 的网卡/芯片类型。(对ne2k-pci.c驱动程序也可以如法炮制。)

问题:ne2k-pci.c驱动程序对PCI NE2000网卡报告诸 如timeout waiting for Tx RDC错误信息,无法正常工作。

原因:你的网卡或网卡到PCI总线的连接无法处理该驱动程序使用的长字I/O优 化。

解决方案:首先,检查BIOS/CMOS设置,看看与PCI总线相关的计时对于可靠的 操作是否过于严格了。否则,使用ISA/PCI的ne.c驱动程序(或者删 除ne2k-pci.c中的#define USE_LONGIO),使你的网卡可用。

问题:没检测到ISA的即插即用NE2000网卡(如RealTek 8019)。

原因:初始的NE2000特性不支持即插即用,因此Linux的NE2000驱动程序也不支 持即插即用。

解决方案:使用网卡所附的DOS配置盘取消PnP,并为该网卡设置一个指定 的I/O地址和IRQ。在/etc/conf.modules里增加这样的一 行options ne io=0xNNN,这里0xNNN是你为网卡设置的16进 制I/O地址。(假设你使用的是模块化驱动程序;否则,在启动时使用一 个ether=0,0xNNN,eth0参数。你也可以进入BIOS/CMOS设置,把IRQ从PnP改 为Legacy-ISA。如果你需要为兼容其它的操作系统而保留PnP设置,那么你可以看一 下isapnptools包。使用man isapnp看看它是否已经安装在你的系 统上了。如果没有,浏览一下下面的连接:

ISA PNP Tools

问题:在启动检测时NE*000驱动程序报告“not found (no reset ack)”。

原因:这跟上面所说的改动有关。在证实8390处于所检测的I/O地址之后,进行 重新设置。在网卡完成重新设置后,应当通知重新设置完成。你的网卡没有通知,所以驱 动程序认为不存在NE网卡。

解决方案:你可以在启动时使用一个未被使用的mem_end16进制 值0xbad,告诉驱动程序你有一个坏网卡。在使用0xbad撤消 时你必须为网卡提供一个非零的I/O地址。例如,在0x340的网卡 不响应重新设置,则使用如下方法:

LILO: linux ether=0,0x340,0,0xbad,eth0

这样,即使你的网卡不响应重新设置,网卡检测还能继续下去。如果你是以模块方式使 用驱动程序,那么可以象提供I/O地址一样提供选项bad=0xbad

问题:NE*000网卡使机器在第一次网络访问时死机。

原因:这个问题从早期的1.1.57内核到现在都出现过,而且只在有限的几种软 件配置的兼容网卡上出现。看来是需要用某些特殊的方法来初始化它们。

解决方案:有几个人报告在热启动(即loadlin或Ctrl-Alt-Del)Linux之前, 运行提供的DOS软件配置程序或提供的DOS驱动程序可以使网卡工作。这表明这些卡需要以 某种特殊的方式初始化,与当前的Linux驱动程序稍有区别。

问题:0x360的NE*000以太网卡没有检测到。

原因:你的NE2000网卡在I/O空间占据了0x20个字节,使它 与0x378处的并口发生冲突。其它可能的设备是0x370处的第 二个软盘控制器(如果有的话),以及0x376--0x377处的第二个IDE控制器。 如果该口已被其它驱动程序注册,内核将不再进行检测。

解决方案:把你的网卡移到0x280, 0x340, 0x320一类的地址, 或者在编译时不支持并行打印机。

问题:每次打印时网络都断开(NE2000)。

原因:与上一个问题相同,但你的内核比较老,不支持对重叠I/O区域的检查。 使用如上的解决方案,有空时获取一个新的内核。

问题:没检测到0xNNN: 00 00 C5 ... 处的NE*000以太网卡。(非法标识yy zz)

原因:首先,你是否在地址0xNNN处有一个NE1000或NE2000网卡?如果有,报告 的硬件地址是否象一个合法地址?如果是的话,那么你的NE*000兼容网卡很差劲。所有的 NE*000兼容网卡都假定网卡上的SA PROM的第14和15字节为0x57。而你的网 卡不是这样 -- 它的值为“yy zz”。

解决方案:有两种解决方法。最简单的方法就是如上所述的“no reset ack” 解决方案,使用一个0xbad的mem_end值。这样在提供一个非零的I/O地址时 就可以忽略标识检查。此方法无需重新编译内核。

第二种方法(对黑客)需要修改驱动程序,并重新编译内核(或模块)。在驱动程 序(/usr/src/linux/drivers/net/ne.c)的42行有一个“Hall of Shame”列表。这个表 是用来检测那些差劲的兼容网卡的。例如,DFI网卡在PROM的前三个字节使用“DFI”,而 不是象要求的那样在第14和15字节使用0x57

问题:机器在启动时出现“8390...”或“WD....”信息后死机。拔掉NE2000就 好了。

解决方案:把你的NE2000地址改为0x340一类的地址。此外,你 可以在和“ether=”参数一起使用“reserve=”启动参数,保护网卡不受其它设备驱动程 序检测的影响。

原因:你的NE2000兼容网卡兼容性不好。一个激活的NE2000是个无底洞,会使 其它的驱动程序陷在其空间内进行自动检测。把NE2000改到一个不常用的地址就可以从其 它的自动检测中消除这一陷阱,机器也就可以启动了。

问题:机器启动时在进行SCSI检测时死机。

原因:这个问题跟上面的一样,改变以太网卡的地址,或使用reserve/ether启 动参数。

问题:机器启动时在进行声卡检测时死机。

原因:不可能,实际上是发生在静默方式的SCSI检测过程中,与上面的问题一样。

问题:启动时检测不到NE2000 - 根本就没有启动信息。

解决方案:因为造成检测不到的原因很多,所以没有“神奇的解决方案”。下 面列出了可能有所帮助的一些措施。

1) 构建一个只包含需要的设备驱动程序的内核。证实你确实是从新内核启动的。忘记 运行lilo等会使你从老的内核启动。(仔细观察启动时报告的构建时间/日期。)听起来很 明显,但我们以前都犯过这个错。通过检查System.map文件 里ne_probe一类的名称,确定驱动程序已包含在新的内核里。

2) 仔细观察启动信息。看看它是否提及正在进行诸如“NE*000 probe at 0xNNN: not found (blah blah)”一类的ne2k检测,或者就是静悄悄地失败了。这里的区别很大。使 用dmesg|more在登录后浏览启动信息,或者在启动完成显示登录提示符时使 用Shift-PgUp卷回屏幕。

3) 启动后,执行cat /proc/ioports,证实网卡要求的全部I/O空间是空 的。如果网卡在0x300,那么ne2k驱动程序要求的空间为0x300-0x31f。 如果其它设备的驱动程序注册了其中的一个口,就不会对该地址进行检测,而是静悄悄地 检测下一个要检测的地址。常见的情况是lp驱动程序保留了0x378,或者第 二个IDE通道保留了0x376,这就使ne驱动程序停止检测0x360-0x380

4) 与上面一样执行cat /proc/interrupts。确定没有其它设备注册了你 为以太网卡设置的中断。这种情况下,检测可以进行,以太网卡驱动程序会在启动时大声 抱怨无法得到所要求的IRQ中断线。

5) 如果你还为驱动程序静悄悄地失败而苦恼,那么编辑并给检测增加一些printk()。 比如,对于ne2k,你可以在linux/drivers/net/ne.c中增加/删除某些行(用 “+”或“-”表示),如下所示:


    int reg0 = inb_p(ioaddr);

+    printk("NE2k probe - now checking %x\n",ioaddr);
-    if (reg0 == 0xFF)
+    if (reg0 == 0xFF) {
+       printk("NE2k probe - got 0xFF (vacant I/O port)\n");
        return ENODEV;
+    }

那么它就会输出检查的每一个口地址信息,你可以看到你的网卡地址是否被检测了。

6) 你还可以从Don的ftp站点(在howto中也提及了)获取ne2k的诊断程序,看看你在启 动进入Linux后能否用它检测你的网卡。使用“-p 0xNNN”选项告诉它在哪 里寻找你的网卡。(缺省情况下只检测0x300,与启动时的探测不同,不会 检测其它的地址。)在找到网卡时的输出如下:


Checking the ethercard at 0x300.
  Register 0x0d (0x30d) is 00
  Passed initial NE2000 probe, value 00.
8390 registers: 0a 00 00 00 63 00 00 00 01 00 30 01 00 00 00 00
SA PROM  0: 00 00 00 00 c0 c0 b0 b0 05 05 65 65 05 05 20 20
SA PROM 0x10: 00 00 07 07 0d 0d 01 01 14 14 02 02 57 57 57 57

        NE2000 found at 0x300, using start page 0x40 and end page 0x80.

你的注册值和PROM值可能会不一样。注意,对16比特网卡,所有PROM值都增加一倍,以 太网卡地址(00:00:c0:b0:05:65)出现在第一行,加倍后的0x57标识出现 在PROM的结尾。

0x300处没有安装网卡时的输出如下:


Checking the ethercard at 0x300.
  Register 0x0d (0x30d) is ff
  Failed initial NE2000 probe, value ff.
8390 registers: ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff
SA PROM        0: ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff
SA PROM 0x10: ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff

 Invalid signature found, wordlength 2.

出现值0xff的原因是在读取空I/O口时返回的就是该值。如果在检测的区 域内有其它硬件,你可以看到一些非0xff的值。

7) 尝试在运行提供的DOS驱动程序或配置程序之后,从DOS启动软盘(通过loadlin)热 启动进入Linux。这可能会进行一些额外的(即非标准的)“魔法”来初始化网卡。

8) 试一下Russ Nelson的ne2000.com包驱动程序,看它能否看见你的网卡 -- 如果还不 行,事情就不大妙了。例如:

A:> ne2000 0x60 10 0x300

所用参数为软件中断向量、硬件IRQ和I/O地址。你可以从任意的msdos存档中 的pktdrv11.zip里找到它 -- 现在的版本大概是11以上了。

3.5 SMC Ultra/EtherEZ和WD80*3网卡的问题

问题:你得到了如下信息:

        eth0: bogus packet size: 65531, status=0xff, nxpg=0xff

原因:是共享内存的问题。

解决方案:最普遍的原因是配置的PCI机器没有映射到ISA内存设备里。因此你 读到的是PC的RAM(全都是0xff值),而不是存放接收数据包数据的网卡上 的RAM。

另一个容易解决的典型问题是板卡冲突,在此区域有缓存或“shadow ROM”,或者你 的ISA总线运行速度高于8Mhz。以太网卡上的内存失效的数目也令人惊奇,所以如果你的 以太网卡有诊断程序的话,运行一下。

问题:SMC EtherEZ在非共享内存(PIO)模式下不工作。

原因:老版本的Ultra驱动程序只支持共享内存模式下的操作。

解决方案:版本2.0以上的内核所附驱动程序就支持可编程I/O模式的操作。升 级到v2.0以上版本。

问题:老的wd8003或可跳线的wd8013总是得到错误的IRQ。

原因:老的wd8003网卡或可跳线的wd8013兼容卡没有驱动程序可以从中读取设 置的IRQ的EEPROM。如果驱动程序无法读到IRQ,就尝试用auto-IRQ发现它。若auto-IRQ返 回0,那么驱动程序就给8比特网卡分配IRQ 5,或者为16比特网卡分配IRQ 16。

解决方案: 使auto-IRQ代码无效,并在你的模块配置文件(对于内建的驱动程 序则通过启动参数)告诉内核你把网卡跳成了什么IRQ。

问题:SMC Ultra网卡被检测成了wd8013,但IRQ和共享内存地址是错的。

原因:Ultra网卡看起来跟wd8013很相象,如果内核里没有Ultra驱动程序,wd驱 动程序就会把ultra误认为wd8013。ultra检测在wd之前,所以一般不会出问题。ultra在EEPROM保 存的IRQ和内存地址与wd8013保存的位置不同,所以报告的值是假的。

解决方案:只保留需要的驱动程序重新编译内核。如果你在同一台机器上同时 使用wd和ultra网卡,并使用模块,那么首先载入ultra模块就行了。

3.6 3Com网卡的问题

问题:3c503选择了IRQ N,但其它设备也需要IRQ N。(比如CD ROM驱动程序、 modem等。)可以不编译进内核就解决这个问题吗?

解决方案:3c503驱动程序按照顺序{5, 9/2, 3, 4}检测空闲的IRQ线,从中找 到一个未被使用的IRQ。在网卡被ifconfig操作配置时选择中断IRQ。

如果你使用的是模块化的驱动程序,可以用模块参数设置各种情况,包括中断IRQ的值。

下面的语句选择IRQ9、基址0x300、<ignored value>和if_port #1(外 部收发器)。

io=0x300 irq=9 xcvr=1

如果驱动程序被编译进了内核,你还可以通过LILO在启动时传递参数来设置同样的值。

LILO: linux ether=9,0x300,0,1,eth0

下面的语句选择IRQ3、检测基址、<ignored value>和缺省if_port #0(外部收 发器)。

LILO: linux ether=3,0,0,0,eth0

问题:3c503: configured interrupt X invalid, will use autoIRQ.

原因:3c503网卡只能使用中断IRQ{5, 2/9, 3, 4}中的一个(这些是网卡所能 连接的中断线。)如果你使用一个不在其中的IRQ值,就会得到如上的提示。一般情况下, 没必要为3c503指定中断值。3c503会在ifconfig配置时使用autoIRQ,并 从IRQ{5, 2/9, 3, 4}中选择一个。

解决方案:使用上述的合法IRQ值,或者不指定IRQ以启用autoIRQ。

问题:提供的3c503驱动程序无法使用AUI(粗缆以太网)端口。怎样才能不使 用缺省的细缆以太网端口而选择AUI端口?

解决方案:3c503的AUI端口对于内建驱动程序可以在启动时选择,对于模块化 驱动程序可以在插入模块时选择。这一选择会覆盖未使用的dev->rmem_start变量的低 比特位,所以启动参数:

LILO: linux ether=0,0,0,1,eth0

对内建在内核的驱动程序起作用。

要在载入模块时指定AUI端口,只需把xcvr=1附加在模块选项包含 你的I/O和IRQ值的那一行就行了。。

3.7 非特定网卡的FAQs

Linux与ISA的即插即用以太网卡

要获得最佳效果(问题最少),推荐使用随网卡附的程序(通常是DOS程序)取消PnP机 制,并给网卡设置一个固定的I/O地址和IRQ。确定你使用的I/O地址在启动时被驱动程序检 测到,如果使用模块,则在/etc/conf.modules中使用io=选 项提供地址。你也可以进入BIOS/CMOS设置,把IRQ从PnP改为Legacy-ISA(如果你的计算机 有此选项的话)。

注意,运行基于DOS的配置程序一般并不需要安装DOS。可以用DOS软盘启动,然后从提 供的软盘上运行它们就可以了。你可以自由地下载OpenDOS和FreeDOS。

如果需要使用PnP以与其它操作系统兼容,你就得每次启动时都使用Linux的isapnptools包 配置网卡。你还需要确定为网卡选择的I/O地址被驱动程序检测到,或用io=选 项提供I/O地址。

启动时没有检测到以太网卡

出现这个问题的常见原因是人们使用的内核不支持特定的网卡。对于模块化的内核,这 一般说明要求的模块尚未被载入,或者需要用模块选项指定其I/O地址。

如果你使用的是模块化的内核,就象大多数用Linux发行版安装的那样,试着用一下该 发行版的配置工具来选择网卡所用模块。对于ISA网卡一个较好的主意是,确定网卡的I/O地 址,如果配置工具要求选项则把它作为一个选项(如io=0x340)加进去。如 果没有配置工具,那么你需要在/etc/conf.modules里添加正确的模块名称 (及选项)-- 阅读man modprobe以了解更多的细节。

如果你使用的发行版套件里的预编译内核,那么查看文档以确定你安装的是哪一种内核, 以及是否支持你所用的网卡。如果不支持的话,要么试着找一个支持你网卡的内核,要么 自己生成一个内核。

只保留所需的驱动程序生成自己的内核是个聪明的主意,因为这会减小内核大小(为应 用程序保留宝贵的RAM!),减少打扰敏感硬件的设备检测数目。生成内核并不象听起来那 么复杂。你只需要对一些有关你想要哪些驱动程序的问题回答是或不是,其它的事都由程 序完成。

另一个主要原因是其它的设备占用了网卡所需的部分I/O空间。大多数网卡在I/O空间里 占用了16或32个字节。如果你的网卡设在0x300并要求32个字节,那么驱动 程序就要求0x300-0x31f。如果某个其它设备驱动程序注册了哪怕其中一个 端口,驱动程序就不会对该地址进行检测,而是静悄悄地进入下一个检测地址。所以,在 启动之后,运行一下cat /proc/ioports以确定网卡要求的全部I/O空间都是 空的。

还有一个问题就是网卡跳到的I/O地址不是缺省检测的地址。每个驱动程序的检测地址 列表可以很容易地在驱动程序源码中的文本注释里找到。即使网卡设定的I/O地址不在检测 地址列表上,你也可以在启动时用ether=命令提供(对内建驱动程序),参 见传递以太网参数...。模块化的驱动程序可 以在/etc/conf.modules里使用io=选项指定一个非缺省检测 的地址。

ifconfig报告了错误的网卡I/O地址

这不可能。你只是理解错误。这是一个Bug,而且报告的数字是正确的。这 只出现在某些基于8390的网卡上(如wd80x3、smc-ultra等),实际的8390芯片位于第一个 给定I/O端口加上一个偏移量处。此偏移量保存在dev->base_addr里,也 就是ifconfig报告的值。如果你想看到网卡使用的全部端口,试一 下cat /proc/ioports以得到想要的数字。

PCI机器探测到了网卡,但驱动程序检测失败。

某些PCI的BIOS在上电时没有启用所有的PCI卡,特别是在使用了“PNP OS”的BIOS选项 情况下。这一特性是为了支持当前依然使用某些实模式驱动程序的Windows版本。或者禁用 该选项,或者升级到一个可以启用被禁用网卡的新驱动程序。

PCI机器里的共享内存ISA网卡不工作(0xffff

这常表现为显示读出大量0xffff值。除非你正确地设置了PCI ROM BIOS/CMOS SETUP配置,任何类型的共享内存网卡都不会在PCI机器上工作。你必须把网卡所用内存区 域设置为可以从ISA总线访问共享内存。如果你不知道哪些设置有用,那么询问你的供应商 或者当地的计算机大拿。对于AMI BIOS,在“Plug and Play”部分有一个“ISA Shared Memory Size”和“ISA Shared Memory Base”的设置。对于类似wd8013和SMC Ultra的网 卡,把共享内存的大小从缺省的禁用改为16kB,并把基址改为网卡的共享内存地址。

网卡看来在发送数据,但没有收到过数据。

执行cat /proc/interrupts。这样产生的列表会显示网卡产生的所有中 断事件的实时数目。如果为0或在试图使用网卡时没有增加,那么可能是与计算机安装的其 它设备发生物理中断冲突(无论其它的设备是否安装/提供了驱动程序)。把其中一个设备 的IRQ改为未使用的IRQ。

异步传输模式(ATM)支持

Werner Almesberger在进行Linux的ATM的支持工作。他使用的是Efficient Networks的ENI155p板(Efficient Networks)和Zeitnet的ZN1221板(Zeitnet)。

Werner说ENI155p的驱动程序已经很稳定了,而ZN1221的驱动程序还没有完成。

去下面的连接查看一下最新的进展:

Linux ATM Support

吉比特以太网支持

Linux支持吉比特以太网吗?

是的,目前至少已经有了两个驱动程序。在v2.0和v2.2内核里有一个Packet Engines G-NIC PCI吉比特以太网适配器的驱动程序。驱动程序的更多细节、支持和更新可访问:

http://cesdis.gsfc.nasa.gov/linux/drivers/yellowfin.html

v2.2内核提供的acenic.c驱动程序可用于Alteon的AceNIC吉比特以太网 卡和其它如3Com的3c985一类的基于Tigon的网卡。这个驱动程序还可以用于NetGear的GA620, 但还需要证实。

FDDI支持

Linux支持FDDI吗?

是的。Larry Stefani为v2.0编写了Digital的DEFEA(FDDI EISA)和DEFPA(FDDI PCI)网 卡驱动程序。它被包含进v2.0.24内核。目前还没有其它的网卡被支持。

全双工支持

全双工能达到20MBps吗?Linux支持吗?

Cameron Spitzer对全双工10Base-T网卡有如下论断:“如果你连在全双工交换HUB上, 你的系统足够快而且不做太多其它的工作,它会使你的网络在两个方向上都保持忙碌。不 存在什么全双工的10BASE-2或10BASE-5(细缆和粗缆)。全双工是通过取消适配器的碰撞 检测来达到的。这就是为什么用同轴电缆实现不了全双工;LAN无法以全双工方式运转。 10BASE-T(RJ45接口)使用不同的线进行发送和接收,所以二者可能同时进行。交换HUB处 理碰撞问题。信号速率是10Mbps。”

所以,你只能以10Mbps速率接收或发送数据,无法期望得到两倍的性能提高。对于是否 支持,取决于网卡和可能的驱动程序。有些网卡可以自动协商,有些需要驱动程序支持, 还有的需要用户在网卡的EEPROM配置中设置选项。只有那些认真的用户会注意到全双工与 半双工模式间的差别。

SMP机器上的Linux以太网卡

如果你有钱买多处理器(MP)的计算机,那么最好买一个好点儿的以太网卡。对v2.0内 核这还不是个问题,但对v2.2就成问题了。大多数老式的非智能(如ISA总线的PIO和共享 内存设计)网卡在设计时根本没考虑多处理器应用。简单地说就是买一个现代设计的智能 网卡,并确定有能够处理多处理器操作的驱动程序。(注意这里的“现代设计” - PCI-NE2000就 是在现代总线上有10多年历史的老式设计。)在驱动程序的源码里查找spin_lock可 以很好地说明该驱动程序是否能够处理多处理器操作。下面详细解释了为何要为多处理器 应用购买好的网卡(以及不买会出现什么问题)。

在v2.0内核,在任意时刻只有一个处理器允许进入“内核态”(即改变内核数据或运行 设备驱动程序)。所以从网卡(及相关驱动程序)的角度来看,这与单处理器操作没有什 么不同,所以不会出问题。(这也是得到一个可以工作的Linux多处理器版本的最简单的办 法 -- 使用一个大锁使得一次只有一个处理器处于内核状态。这样你就知道不可能有两个 处理器同时要修改同一数据!)

在任意时刻只有一个处理器允许进入内核态的不利之处在于只有运行自我控制和密集计 算的程序时才会获得多处理器的优越性。如果程序进行了大量诸如向磁盘或网络读/写数据 的I/O操作,在处于内核的那个处理器努力运行所有的设备驱动程序以满足I/O请求的同时, 其它的处理器都必须等待自己的I/O请求被处理完成。这样内核就成为了瓶颈,由于只有一 个处理器运行在内核态,多处理器机器的性能在I/O任务重、单锁的情况下迅速降级到接近 单处理器的水平。

很明显这与理想情况相差太远(尤其是对于文件/WWW服务器、路由器等),v2.2的内核 就使用了粒度更小的锁——也就是说同时可以有多个处理器进入内核。不再是对整个内核 使用一个大锁,而是使用许多较小的锁保护关键数据,防止同时被多个处理器控制——例 如,一个处理器可以运行网卡驱动程序,同时另一个处理器可以运行磁盘驱动器的驱动程 序。

好的,这样就有问题了:更小的锁定就意味着可以有一个处理器试图通过以太网驱动程 序发送数据,同时另一个处理器试图访问同一个驱动程序/网卡来做别的事情(比如通 过cat /proc/net/dev得到网卡统计数据)。哎呦——你的网卡正在通过网 线发数据,你又要用它来收数据。网卡被同时要求做两件事(或更多),会弄糊涂的,所 以有可能在处理过程中网卡使你的机器死机。

因此,为单处理器写的驱动程序不再适用——它需要更新控制对网卡访问的锁,使得网 卡的接收、发送和操作配置数据这三种任务以网卡稳定操作所要求的程度串行化起来。没 有更新为使用稳定多处理器操作的锁的驱动程序在轻的网络负载下可能看起来会正常工作, 但在两个(或更多)处理器试图同时进行多个任务时就会造成死机,或至少表现出奇怪的 行为,这就是问题。

更新后的意识到多处理器的以太网驱动程序将要求一个驱动程序范围的锁,使得内核进 入驱动程序的访问入口被限制为一次一个。这样,任务就被串行化,而对硬件的处理就如 同在单处理器下一样,也就一定应当稳定。使用驱动程序范围的锁的不利之处在于它类似 于对整个内核加锁(但规模较小)对性能的影响——也就是说,一次只可以有一个处理器 处理网卡。[技术提示:如果增加的锁是irqsave类型的而且被持有较长时间, 对性能的影响还包括增加了中断延迟。]

这里可以进行的改进有两处。可以尝试减少获得与释放锁之间所用的时间,或者在驱动 程序内部实现更为细化的锁(比如满足网卡需求的前提下,把整个驱动程序的锁替换为若 干保护同时访问若干敏感寄存器或设置的锁)。

但是,对于老式的非智能网卡而言,在设计时根本就没有考虑过多处理器的应用,这样 的改进可能无法实现。更糟的是非智能网卡一般要求处理器在网卡和内存之间传送数据, 所以在最坏的情况下,每当在ISA总线传送1.5kB数据包时,锁都被一直保持着。

现代的智能网卡一般无需处理器的帮助就可以直接在网卡和内存之间传递网络数据。这 是个很大的改进,因为只需要在处理器通知网卡使用哪一块内存保存下一个网络数据包的 那一小段时间持有锁。现代的网卡在设计时同样也不要求对整个驱动程序使用一个大锁。

Alpha/AXP的PCI板上的Linux以太网卡

对于v2.0,只有3c509、depca、de4x5、pcnet32和所有8390驱动程 序(wd、smc-ultra、ne、3c503等等)是编写成“结构无关”的,所以它们可以运行在基 于DEC的Alpha CPU系统上。其它一些从Donald的WWW主页上下载的更新过的PCI驱动程序也 可以工作,因为它们也是按照结构无关的思想编写的。

注意,使驱动程序与结构无关所需要进行的改动并不很复杂。只需要如下进行:

--把所有与jiffies有关的值都乘以HZ/100,得到Alpha使用的不同的HZ值。 (即timeout=2;变成timeout=2*HZ/100;

--把所有I/O内存(从640k到1MB)的指针引用替换为相应的readb() writeb() readl() writel()调 用,如下例所示。


-       int *mem_base = (int *)dev->mem_start;
-       mem_base[0] = 0xba5eba5e;
+       unsigned long mem_base = dev->mem_start;
+       writel(0xba5eba5e, mem_base);

--把所有使用I/O内存作为源或目的地址的memcpy()调用替换为相应 的memcpy_fromio()或者memcpy_toio()调用。

以结构无关的方式处理内存访问的细节在近期的内核所附的文 件linux/Documentation/IO-mapping.txt中进行了说明。

SUN/Sparc硬件上的Linux以太网卡

要得到最新的Sparc信息,可以访问以下URL:

Linux Sparc

注意,有些Sparc的以太网硬件从主机获得其MAC地址,因此可能会有多个接口具有相同 的MAC地址。如果想在同一个网络上使用多个接口,可以使用ifconfighw选 项以分配唯一的MAC地址。

把PCI驱动程序移植到Sparc平台上与上面提到的AXP平台相似。可能的差异出在endian上, 因为Sparc是big endian,而AXP和ix86是little endian。

其它硬件上的Linux以太网卡

还有一些其它硬件平台可以运行Linux,比如Atari/Amiga(m68k)。就象Sparc一样, 最好是访问每个Linux支持的平台主页,以了解当前都支持哪些硬件。(欢迎提供这样的站 点连接——把它们发给我!)

不使用Hub连接10/100BaseT

可以不使用Hub连接基于10/100BaseT(RJ45)的系统吗?

如果不使用额外的设备或机械装置,可以很容易地连接两台这样的机器,但不可能再多。 参阅双绞线——解释了如何做到这一点。而且你不 可能简单地交叉几根线或其它什么就弄出一个Hub,不复制Hub也无法正确完成冲突信号。

SIOCSIFxxx: No such device

在启动时出现了一大堆“SIOCSIFxxx: No such device”信息,后面还有一 条“SIOCADDRT: Network is unreachable”,怎么回事?

你的以太网设备在启动/插入模块时没有被检测到, 当ifconfigroute运行时,它们没有可用的设备。使 用dmesg | more来浏览启动信息,看看有没有检测以太网卡的信息。

SIOCSFFLAGS: Try again

在运行“ifconfig”时出现“SIOCSFFLAGS: Try again”——怎么回事?

某些其它的设备使用了以太网卡想用的IRQ,所以以太网卡无法使用该IRQ。你不必重新 启动来解决这个问题,因为某些设备只是在需要时才获取IRQ,在完成后就释放了。例如某 些声卡、串口、软盘驱动器等。你可以键入cat /proc/interrupts来看看哪 些中断正在被使用。绝大多数Linux以太网卡驱动程序只有在用“ifconfig”打 开时才获取IRQ。如果你能让其它设备“放开”所需的IRQ中断线,那么你就可以 用ifconfig来“再试一下”了。

使用“ifconfig”得到的连接为UNSPEC,而硬件地址是00:00:00:00:00:00

在不带参数运行ifconfig时,报告说连接为UNSPEC(而不是10Mbs以太网),而且硬件 地址都是零。

这是因为运行的“ifconfig”程序版本比内核的版本高。在与老版本的内核一起运行时, 新版本的ifconfig无法报告这些特性。你可以升级内核,或者“降级”ifconfig,或者干 脆不理会这个错误。内核知道硬件地址,所以即使ifconfig无法读出它也没有关系。

如果使用的ifconfig程序比使用的内核旧很多的话,也会出现一些奇怪 的信息。

大量的RX和TX错误

在不带参数运行ifconfig时,报告大量的接收和发送数据包错误。但看起来工作正 常——怎么回事?

再看一遍。报告是说RX packets big number 停 顿 errors 0 停顿 dropped 0 停 顿 overrun 0。所以你看到的那个大数字是机器接收和发送的数据包总 数。如果还觉得不可思议,键入cat /proc/net/dev试试。

/dev/下以太网卡的入口

/dev/eth0象是个到/dev/xxx的连接。这样对吗?

与你听过的正好相反,/dev/*下的文件没被使用。你可以删除掉任 何/dev/wd0, /dev/ne0以及类似的入口。

Linux与“trailers”

在“ifconfig”网卡时,需要禁止trailers吗?

不能禁止trailers,而且也没必要。“trailers”是避免在网络层复制数据的工具。其 想法是使用一个大小为“H”的固定大小的头,把可变大小的头信息放在包的尾部,并把所 有包定位在页开始之前的“H”字节。这只是个好想法,在实际中工作得并不好。如果有人 建议使用“-trailers”,那不过是找个替罪羊罢了。这对解决问题没有任何意义,但如果 问题真的自行解决了,那么他就可以吹嘘自己的神奇本领了。

访问原始以太网设备

在Linux下怎样不通过TCP/IP之类的东西访问原始的以太网设备?


        int s=socket(AF_INET,SOCK_PACKET,htons(ETH_P_ALL));

这样就可以得到一个接收所有协议类型的socket。对它执行recvfrom()调 用,它就会用sa_family里的设备类型和sa_data数组里的设备名来填充sockaddr。我不知 道是谁最早在Linux里使用SOCK_PACKET,但它确实是个非常好的东西。你也可以通 过sendto()调用发送原始数据包。当然,在这样做时你必须拥有root的权限。


Next Previous Contents