Linux-网卡驱动介绍以及制作虚拟网卡驱动
描述
网卡的驱动还是与硬件有关,注意是负责收发网络的数据包,它将上层协议传递下来的数据包,以特定的媒介访问控制方式进行发送,并将接收到的数据包传递给上层协议。
网卡设备与字符设备和块设备不同,网卡设备并不对应与/dev目录下的文件,不过会放在/sys/class/net目录下。
linux系统对网络设备驱动定义了4个层次,这四个层次为:
- 网络协议接口层
实现统一的数据包收发的协议,该层主要负责调用dev_queue_xmit()函数发送数据, netif_rx()函数接收数据。 - 网络设备接口层
通过net_device结构体来描述一个具体的网络设备的信息,实现不同的硬件的统一。 - 设备驱动功能层
用来负责驱动网络设备硬件来完成各个功能, 它通过hard_start_xmit() 函数启动发送操作, 并通过网络设备上的中断触发接收操作。 -
网络设备与媒介层
用来负责完成数据包发送和接收的物理实体, 设备驱动功能层的函数都在这物理上驱动的。
网卡驱动初始化
网卡驱动程序,只需要编写网络设备接口层,填充net_device数据结构的内容并将net_device注册入内核,设置硬件相关操作,使能中断处理等。
其中net_device结构体的重要成员
struct net_device
{
char name[IFNAMSIZ]; //网卡设备名称
unsigned long mem_end; //该设备的内存结束地址
unsigned long mem_start; //该设备的内存起始地址
unsigned long base_addr; //该设备的内存I/O基地址
unsigned int irq; //该设备的中断号
unsigned char if_port; //多端口设备使用的端口类型
unsigned char dma; //该设备的DMA通道
unsigned long state; //网络设备和网络适配器的状态信息
struct net_device_stats* (*get_stats)(struct net_device *dev); //获取流量的统计信息
//运行ifconfig便会调用该成员函数,并返回一个net_device_stats结构体获取信息
struct net_device_stats stats; //用来保存统计信息的net_device_stats结构体
unsigned long features; //接口特征,
unsigned int flags; //flags指网络接口标志,以IFF_(Interface Flags)开头
//当flags =IFF_UP( 当设备被激活并可以开始发送数据包时, 内核设置该标志)、 IFF_AUTOMEDIA(设置设备可在多种媒介间切换)、
IFF_BROADCAST( 允许广播)、IFF_DEBUG( 调试模式, 可用于控制printk调用的详细程度) 、 IFF_LOOPBACK( 回环)、
IFF_MULTICAST( 允许组播) 、 IFF_NOARP( 接口不能执行ARP,点对点接口就不需要运行 ARP) 和IFF_POINTOPOINT( 接口连接到点到点链路) 等。
unsigned mtu; //最大传输单元,也叫最大数据包
unsigned short type; //接口的硬件类型
unsigned short hard_header_len; //硬件帧头长度,一般被赋为ETH_HLEN,即14
unsigned char dev_addr[MAX_ADDR_LEN]; //存放设备的MAC地址
unsigned long last_rx; //接收数据包的时间戳,调用netif_rx()后赋上jiffies即可
unsigned long trans_start; //发送数据包的时间戳,当要发送的时候赋上jiffies即可
unsigned char dev_addr[MAX_ADDR_LEN]; //MAC地址
int (*hard_start_xmit) (struct sk_buff *skb, struct net_device *dev);
//数据包发送函数, sk_buff就是用来收发数据包的结
void (*tx_timeout) (struct net_device *dev); //发包超时处理函数
上面讲到的统计信息net_device_stats结构体,其中重要成员如下所示:
struct net_device_stats
{
unsigned long rx_packets; /*收到的数据包数*/
unsigned long tx_packets; /*发送的数据包数 */
unsigned long rx_bytes; /*收到的字节数,可以通过sk_buff结构体的成员len来获取*/
unsigned long tx_bytes; /*发送的字节数,可以通过sk_buff结构体的成员len来获取*/
unsigned long rx_errors; /*收到的错误数据包数*/
unsigned long tx_errors; /*发送的错误数据包数*/
... ...
}
所以init函数,初始化网卡步骤如下所示
- 使用alloc_netdev()来分配一个net_device结构体
- 设置网卡硬件相关的寄存器
- 设置net_device结构体的成员
- 使用register_netdev()来注册net_device结构体
网卡驱动发包过程
在内核中,当上层发送一个数据包时,就会调用网络设备层里net_device数据结构的成员hard_start_xmit()将数据包发送出去。
int (*hard_start_xmit) (struct sk_buff *skb, struct net_device *dev);
这个函数中需要涉及到sk_buff结构体,含义为(socket buffer)套接字缓冲区,用来网络各个层次之间传递数据。
struct sk_buff {
/* These two members must be first. */
struct sk_buff *next; //指向下一个sk_buff结构体
struct sk_buff *prev; //指向前一个sk_buff结构体
... ...
unsigned int len, //数据包的总长度,包括线性数据和非线性数据
data_len, //非线性的数据长度
mac_len; //mac包头长度
__u32 priority; //该sk_buff结构体的优先级
__be16 protocol; //存放上层的协议类型,可以通过eth_type_trans()来获取
... ...
sk_buff_data_t transport_header; //传输层头部的偏移值
sk_buff_data_t network_header; //网络层头部的偏移值
sk_buff_data_t mac_header; //MAC数据链路层头部的偏移值
sk_buff_data_t tail; //指向缓冲区的数据包末尾
sk_buff_data_t end; //指向缓冲区的末尾
unsigned char *head, //指向缓冲区的协议头开始位置
*data; //指向缓冲区的数据包开始位置
... ...
其中sk_buff结构体的空间,如下图所示:
其中sk_buff-> data数据包格式如下图所示:
所以,hard_start_xmit()发包函数处理步骤如下所示:
- 把数据包发出去之前,需要使用netif_stop_queue()来停止上层传下来的数据包。
- 设置寄存器,通过网络设备硬件,来发送数据。
- 当数据包发出去后, 再调用dev_kfree_skb()函数来释放sk_buff,该函数原型如下:
- 当数据包发出成功,就会进入TX中断函数,然后更新统计信息,调用netif_wake_queue()来唤醒,启动上层继续发包下来.
- 若数据包发出去超时,一直进不到TX中断函数,就会调用net_device结构体的(*tx_timeout)超时成员函数,在该函数中更新统计信息, 调用netif_wake_queue()来唤醒
其中netif_wake_queue()和netif_stop_queue()函数原型如下所示:
void netif_wake_queue(struct net_device *dev); //唤醒被阻塞的上层,启动继续向网络设备驱动层发送数据包
void netif_stop_queue(struct net_device *dev); //阻止上层向网络设备驱动层发送数据包
网卡驱动收包过程
接收数据包主要通过中断函数处理,来判断中断类型,如果等于ISQ_RECEIVER_EVENT,表示为接收中断,然后进入接收数据函数,通过netif_xr()将数据上交给上层。
内核中自带的网卡驱动:/drivers/net/cs89x0.c
通过获取的status标志来判断是什么中断,如果是接收中断,就进入net_rx()
其中net_rx()收包函数处理步骤如下所示:
- 用dev_alloc_skb()来构造一个新的sk_buff
- 使用skb_reserve(rx_skb, 2); 将sk_buff缓冲区里的数据包先后位移2字节,来腾出sk_buff缓冲区里的头部空间
- 读取网络设备硬件上接收到的数据
- 使用memcpy()将数据复制到新的sk_buff里的data成员指向的地址处,可以使用skb_put()来动态扩大sk_buff结构体里中的数据区
- 使用eth_type_trans()来获取上层协议,将返回值赋给sk_buff的protocol成员里
-
然后更新统计信息,最后使用netif_rx( )来将sk_fuffer传递给上层协议中
使用skb_put()函数后,其中sk_buff缓冲区变化如下图:
写虚拟网卡驱动
不需要硬件相关操作,所以就没有中断函数,我们通过linux的ping命令来实现发包,然后在发包函数中伪造一个收的ping包函数,实现能ping通任何ip地址.
在init初始函数中
- 使用alloc_netdev()来分配一个net_device结构体
- 设置net_device结构体的成员
- 使用register_netdev()来注册net_device结构体
在发包函数中:
- 使用netif_stop_queue()来阻止上层向网络设备驱动层发送数据包
- 调用收包函数,并代入发送的sk_buff缓冲区, 里面来伪造一个收的ping包函数
- 使用dev_kfree_skb()函数来释放发送的sk_buff缓存区
- 更新发送的统计信息
- 使用netif_wake_queue()来唤醒被阻塞的上层,
在收包函数中:
首先修改发送的sk_buff里数据包的数据,使它变为一个接收的sk_buff,其中数据包结构如下图所示:
- 需要对调上图的ethhdr结构体 ”源/目的”MAC地址
- 需要对调上图的iphdr结构体”源/目的” IP地址
- 使用ip_fast_csum()来重新获取iphdr结构体的校验码
- 设置上图数据包的数据类型,之前是发送ping包0x08,需要改为0x00,表示接收ping包
- 使用dev_alloc_skb()来构造一个新的sk_buff
- 使用skb_reserve(rx_skb, 2);将sk_buff缓冲区里的数据包先后位移2字节,来腾出sk_buff缓冲区里的头部空间
- 使用memcpy()将之前修改好的sk_buff->data复制到新的sk_buff里的data成员指向的地址处:
- 设置新的sk_buff 其它成员
- 使用eth_type_trans()来获取上层协议,将返回值赋给sk_buff的protocol成员里
- 然后更新接收统计信息,最后使用netif_rx( )来将sk_fuffer传递给上层协议中
驱动具体代码
#include <linux/module.h>
#include <linux/errno.h>
#include <linux/netdevice.h>
#include <linux/etherdevice.h>
#include <linux/kernel.h>
#include <linux/types.h>
#include <linux/fcntl.h>
#include <linux/interrupt.h>
#include <linux/ioport.h>
#include <linux/in.h>
#include <linux/skbuff.h>
#include <linux/slab.h>
#include <linux/spinlock.h>
#include <linux/string.h>
#include <linux/init.h>
#include <linux/bitops.h>
#include <linux/delay.h>
#include <linux/ip.h>
#include <asm/system.h>
#include <asm/io.h>
#include <asm/irq.h>
static struct net_device *virt_net;
static void virt_rs_packet(struct sk_buff *skb, struct net_device *dev)
{
unsigned char *type;
struct iphdr *ih;
__be32 *saddr, *daddr, tmp;
unsigned char tmp_dev_addr[ETH_ALEN];
struct ethhdr *ethhdr;
struct sk_buff *rx_skb;
/*1) 对调ethhdr结构体 "源/目的"MAC地址*/
ethhdr = (struct ethhdr *)skb->data;
memcpy(tmp_dev_addr, ethhdr->h_dest, ETH_ALEN);
memcpy(ethhdr->h_dest, ethhdr->h_source, ETH_ALEN);
memcpy(ethhdr->h_source, tmp_dev_addr, ETH_ALEN);
/*2)对调 iphdr结构体"源/目的" IP地址*/
ih = (struct iphdr *)(skb->data + sizeof(struct ethhdr));
saddr = &ih->saddr;
daddr = &ih->daddr;
tmp = *saddr;
*saddr = *daddr;
*daddr = tmp;
/*3)使用ip_fast_csum()来重新获取iphdr结构体的校验码*/
ih->check = 0;
ih->check = ip_fast_csum((unsigned char *)ih,ih->ihl);
/*4)设置数据类型*/
type = skb->data + sizeof(struct ethhdr) + sizeof(struct iphdr);
*type = 0; //之前是发送ping包0x08,需要改为0x00,表示接收ping包
/*5)使用dev_alloc_skb()来构造一个新的sk_buff */
rx_skb = dev_alloc_skb(skb->len + 2);
/*6)使用skb_reserve()来腾出2字节头部空间 */
skb_reserve(rx_skb, 2);
/*7)使用memcpy()将之前修改好的sk_buff->data复制到新的sk_buff里*/
memcpy(skb_put(rx_skb, skb->len), skb->data, skb->len); // skb_put():来动态扩大sk_buff结构体里中的数据区,避免溢出
/*8)设置新的sk_buff 其它成员*/
rx_skb->dev = dev;
rx_skb->ip_summed = CHECKSUM_UNNECESSARY; /* don't check it */
/*9)使用eth_type_trans()来获取上层协议 */
rx_skb->protocol = eth_type_trans(rx_skb, dev);
/*10) 更新接收统计信息,并使用netif_rx( )来 传递sk_fuffer收包 */
dev->stats.rx_packets++;
dev->stats.rx_bytes += skb->len;
dev->last_rx= jiffies; //收包时间戳
netif_rx(rx_skb);
}
static int virt_send_packet(struct sk_buff *skb, struct net_device *dev)
{
/*1)使用netif_stop_queue()来阻止上层向网络设备驱动层发送数据包*/
netif_stop_queue(dev);
//期间设置硬件发送数据包
/*2)调用收包函数,里面来伪造一个收的ping包函数*/
virt_rs_packet(skb,dev);
/*3)使用dev_kfree_skb()函数来释放发送的sk_buff缓存区*/
dev_kfree_skb(skb);
/*4)更新发送的统计信息*/
dev->stats.tx_packets++; //成功发送一个包
dev->stats.tx_bytes+=skb->len; //成功发送len长字节
dev->trans_start = jiffies; //发送时间戳
/*5)使用netif_wake_queue()来唤醒被阻塞的上层*/
netif_wake_queue(dev);
return 0;
}
static int virt_net_init(void)
{
/*1)使用alloc_netdev()来分配一个net_device结构体*/
virt_net= alloc_netdev(sizeof(struct net_device), "virt_eth0", ether_setup);
/*2)设置net_device结构体的成员 */
virt_net->hard_start_xmit = virt_send_packet;
virt_net->dev_addr[0] = 0x08;
virt_net->dev_addr[1] = 0x89;
virt_net->dev_addr[2] = 0x89;
virt_net->dev_addr[3] = 0x89;
virt_net->dev_addr[4] = 0x89;
virt_net->dev_addr[5] = 0x89;
virt_net->flags |= IFF_NOARP;
virt_net->features |= NETIF_F_NO_CSUM;
/*3)使用register_netdev()来注册net_device结构体 */
register_netdev(virt_net);
return 0;
}
static void virt_net_exit(void)
{
unregister_netdev(virt_net);
free_netdev(virt_net);
}
module_init(virt_net_init);
module_exit(virt_net_exit);![1182576-20171031191155154-1353223217.png](https://img.haomeiwen.com/i2878032/af431a7b9ed529c5.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
MODULE_LICENSE("GPL");
MODULE_AUTHOR("by:zhang");
测试运行
挂载驱动,如下图所示,可以看到net类下就有了这个网卡设备
insmod 16_th_virt_net.ko
ls /sys/class/net/
开始试验,首先设置这个网卡设备的ip,然后去ping一下其它的ip,如下图所示:
上图的ping,之所以成功,是因为我们在发包函数中,伪造了一个来收包,通过netif_rx()来将收包上传给上层
使用ifconfig,可以看到这个网卡设备的统计信息共收发了6个包,以及收发的总数据